24일(현지시간) 오픈AI와 로이터통신 등에 따르면 할라페뇨는 대규모언어모델(LLM) 추론에 특화한 AI 가속기다. 추론은 이미 학습된 AI 모델이 이용자 질문에 답하거나 작업을 수행하는 과정이다. 오픈AI는 이 칩을 “범용 반도체가 아니라 자사 서비스의 처리 방식에 맞춰 설계했다”고 밝혔다.
오픈AI는 할라페뇨에 대해 “현재와 차세대 LLM을 빠르고 효율적으로 구동하도록 만들어졌다”고 설명했다. 초기 시험에서는 전력 대비 성능 개선 가능성이 확인됐다. 구체적인 수치는 추후 기술 보고서에서 공개할 예정이다.
칩 구현과 네트워킹 기술은 브로드컴이 맡았고, 서버 시스템은 셀레스티카가 구축한다. 제조는 대만 TSMC가 담당했다. 오픈AI는 “설계부터 제조 의뢰까지 약 9개월이 걸렸으며, 이 과정에서 자사 AI 모델을 활용해 일부 설계와 최적화 작업을 앞당겼다”고 설명했다.
오픈AI는 “현재 실험실에서 시제품을 구동하고 있다”며 “GPT-5.3-코덱스-스파크 모델을 대상으로 목표 전력과 성능 수준에서 머신러닝(데이터 기반 학습·예측) 작업을 실행하고 있다”고 밝혔다.
브로드컴의 혹 탄 최고경영자(CEO)는 로이터통신 인터뷰에서 “할라페뇨가 엔비디아의 블랙웰 칩이나 구글의 텐서처리장치(TPU)에 견줄 수 있다”고 말했다. 아울러 그는 삼성전자와 SK하이닉스가 브로드컴에 메모리 반도체를 공급하고 있다고 전했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



