[단독] 갈 길 먼 K-AI 반도체 성능…2세대 조기 출시 시급

초거대 AI 핵심 언어모델서 약점 드러내
'슈퍼 갑' 엔비디아 독주 못 막으면 자체 AI 생태계 구축 불가능
영상모델은 엔비디아 넘어서는 성과...K-AI 반도체 승산 있어
올 하반기 2세대 제품 시동...약점 보완하고 초거대 AI·자율차 사업 확대

국산 AI 반도체는 최근 생성형 AI 열풍을 불러온 챗GPT의 핵심 기능인 언어모델 추론(실행) 능력도 미국산 대비 크게 떨어지는 것으로 나타났다. 특히 초거대 AI를 포함해 AI 학습에 널리 활용되는 32비트 부동소수점(FP32)을 지원하는 국산 AI 반도체는 하나도 없어 선진국과의 격차를 여실히 드러냈다.

관련기사: 전략 무기 된 AI 반도체…한국산 성능은 美 엔비디아 절반에 그쳐

5일 ML커먼스가 실시한 글로벌 AI 반도체 성능 평가 결과에 따르면 △리벨리온의 '아톰' △사피온의 'X220 엔터프라이즈' △퓨리오사AI의 '워보이' 등 국산 AI 반도체 중 32비트 부동소수점(FP32)을 지원하는 제품은 하나도 없었다. FP32는 초거대 AI를 포함해 AI 학습에 꼭 필요한 연산 기능으로 챗GPT 등 생성형 AI 기술의 근간을 이룬다. 반면 미국 엔비디아의 주력 AI 반도체인 A100은 4비트 정수(INT4)부터 FP32까지 모두 지원해 국산 제품과 대조를 이뤘다. 리벨리온과 사피온, 퓨리오사AI는 국내 AI 반도체 설계회사(팹리스)다.

◆AI 학습은 엔비디아 줘도 AI 실행은 안 된다...언어모델 개선 시급

관련기사

국산 AI 반도체가 FP32 기능을 지원하지 않는 것은 전략적 선택이라는 해석도 나온다. 이미 한참 뒤떨어진 AI 모델 학습 분야를 포기하고 향후 급성장할 것으로 예상되는 저전력 AI 추론 시장에 집중하려는 것이다. 실제로 국산 AI 반도체는 모두 A100보다 전력 효율(TDP)이 우수했다. A100이 300W의 전력을 소모하는 반면 △아톰 30~75W △X220 엔터프라이즈 135W △워보이 40~60W 전력을 소모하는 것으로 확인돼 국산 AI 반도체를 사용하면 저전력 추론 시장에서 AI 운영비를 절반 이하로 줄일 수 있을 전망이다.

하지만 챗GPT 등으로 대표되는 언어모델 추론(Bert-Large) 능력의 경우 많은 개선이 필요한 것으로 확인됐다. 아톰을 제외하면 다른 국산 AI 반도체는 언어모델 추론을 지원하지 않아 2세대에서 가장 시급하게 개선해야 할 문제점으로 꼽혔다. 아톰도 언어모델 추론 속도가 4.30ms를 기록해 1.57ms를 기록한 A100의 3분의 1 수준이었다(낮을 수록 우수).

챗GPT로 인해 초거대 AI 모델 개발 열풍이 불면서 A100을 포함한 엔비디아 AI 반도체는 웃돈을 얹어주고도 구하지 못할 정도로 인기를 끌고 있다. A100의 차기 모델인 'H100'도 벌써부터 가격에 프리미엄이 붙고 있다. 이런 유례 없는 인기에 힘입어 엔비디아 주가는 챗GPT 공개 이후 3배 이상 올랐고, 삼성전자, 인텔 등을 제치고 세계 최고 반도체 회사로서 입지를 공고히 했다. 빅테크에서 메타(페이스북)를 빼고 엔비디아를 대신 넣어야 한다는 말까지 나올 정도다.

이미 AI 업계에선 엔비디아가 AI 반도체를 주지 않으면 AI 모델 학습·추론 모두 불가능하다는 게 정설이다. 모두가 눈치를 봐야 하는 '슈퍼 갑'이 된 것이다. 삼성전자가 AMD로 AI 공급망을 다각화하는 배경에도 이러한 슈퍼 갑에 대한 우려가 있다. 국내 AI 반도체 기업이 언어모델 추론 관련 연구·개발에 뒤처지면 안 되는 이유이기도 하다.

대신 동영상·CCTV 분석에 널리 활용되는 영상모델 추론(ResNet50) 능력은 벌써부터 A100 성능을 넘어서는 제품이 나오는 등 국산 AI 반도체의 가능성을 보여줬다는 평가를 받았다. 영상모델 추론은 국내외 모든 AI 반도체가 지원하며 처리 속도는 △아톰 0.24ms △A100 0.48ms △워보이 0.71ms 순이었다. X220 엔터프라이즈는 영상모델 추론을 지원하는 것은 확인됐지만 구체적인 결과를 MLPerf에 제출하지 않았다.

◆1세대는 시작 불과...2세대로 초거대 AI·자율주행차 공략

이번 조사를 통해 국산 AI 반도체 성능이 선진국 대비 크게 뒤떨어지는 것으로 나타났지만, 이를 따라잡기 위한 국산 AI업체들의 노력은 벌써부터 진행 중이다. 국산 AI 반도체는 2세대 제품을 조기 투입하며 정부 K-클라우드 사업과 민간 AI 서비스 등에서 성과를 낼 방침이다.

가장 공격적인 행보를 보이는 곳은 퓨리오사AI다. 퓨리오사AI는 올해 상반기 2세대 AI 반도체 '레니게이드' 설계를 마무리하고 하반기 중 양산에 착수한다. 미국 AI 모델 플랫폼 '허깅페이스'에 이어 LG AI 연구원과 협약을 맺으며 언어모델 추론 능력에 대해 자신감을 드러냈다. 퓨리오사AI와 LG AI 연구원은 초거대 AI '엑사원'을 레니게이드에서 추론함으로써 효율적인 생성 AI 운영 방안을 찾을 계획이다.

MLPerf를 통해 공식 스펙과 실제 성능이 드러나지는 않았지만, 반도체 업계에 따르면 레니게이드는 TSMC 5nm 공정에서 제작되며 INT8과 FP16을 모두 지원한다. 메모리도 HBM3(고대역메모리) 24GB를 탑재해 고객사가 원할 경우 AI 모델 학습에도 활용할 수 있도록 할 계획이다. INT8 처리능력도 512 TOPS(Tera Operations Per Second)에 달해 A100에 버금가는 트랜지스터 규모를 갖출 것으로 예상된다.

사피온도 올해 하반기 중에 데이터센터·자율자동차·사물인터넷 등 다양한 분야에 활용할 수 있는 2세대 AI 반도체 'X300' 시리즈를 공개할 방침이다. X300 시리즈 역시 INT8과 FP16을 모두 지원한다. 사피온은 데이터센터와 함께 자율자동차 시장 공략에도 공을 들인다. 사피온이 텔레칩스에 X300 시리즈 설계도를 제공하면 텔레칩스가 이를 토대로 자율주행차의 두뇌인 ADAS(첨단운전자보조시스템)를 만들어 현대자동차 등 완성차 업체에 공급하는 계획이다. 특히 2026년 하반기에 공개할 3세대 AI 반도체 'X400' 시리즈의 경우 엔비디아 출신인 마이클 쉐바노우 최고기술책임자(CTO) 주도로 설계 경쟁력을 높이기 위한 노력을 하고 있는 것으로 알려졌다.

리벨리온은 연내 아톰의 성능을 한 단계 업그레이드한 '2세대 아톰'을 공개하는 데 이어 2024년에는 엔비디아의 학습용 AI 반도체와 정면 승부하는 250W급 학습용 AI 반도체 '1세대 리벨'을 공개할 계획이다. 1세대 리벨은 FP16 처리 성능이 512 TFLOPS(Tera Floating Point Operations Per Second)에 달해 아톰보다 15배 이상 우수한 성능을 내는 게 목표다.