
카카오는 그간 자체 AI 모델을 꾸준히 연구‧개발해 왔다. 카카오톡 등 대규모 서비스 운영 경험도 갖춘 만큼 이를 접목해 전 국민의 AI 접근성을 높이고, 국가 AI 경쟁력 강화에 기여한다는 방침이다.
카카오는 자체 개발 AI 모델 ‘카나나’를 통해 기술 경쟁력을 증명하고 있다. 카나나는 세 가지 종류의 언어모델(LLM)과 멀티모달(텍스트‧이미지‧음성‧영상 등 동시 처리) 언어모델(MLLM) 3종을 비롯해 시각물 생성모델 2종, 음성모델 2종 등으로 구성됐다.
AI 생태계 확장과 기술 접근성 강화를 위해 이를 누구나 활용할 수 있는 개방형으로도 공개하고 있다. 지난달에는 카나나 중 8B(중형)와 2.1B(경량) 크기 모델을 허깅페이스(개방형 AI플랫폼)에 공개했다. 아파치 2.0 권한을 적용해 누구나 자유로운 수정과 상업적 활용이 가능하다.

공개 모델은 ‘카나나 1.5’다. 세부적으론 각 크기 모델을 베이스와 인스트럭터로 나눠 총 4종이다. 지난 2월 말 선보인 모델 대비 성능이 향상됐다. 카카오는 에이전틱 AI(각종 작업 수행에 자율적이고 능동적인 AI) 구현 목적 기능 강화에 중점을 뒀다.
글로벌 모델 대비 뛰어난 한국어 성능을 유지한다. 공개 모델 중 8B(매개변수 십억 단위)-인스트럭터 모델은 한국어 언어 모델(LLM) 성능 평가 플랫폼 ‘호랑이(Horang-i) 리더보드’에서 8B 사이즈(매개변수 80억개) 이하 모델 중 1위를 기록하기도 했다. 카카오 측은 “처음부터 전 과정을 설계‧개발한 국산 모델이 거둔 성과란 점에서 고무적”이라고 평가했다.
카카오는 현재 한 단계 높은 성능을 갖춘 ‘카나나 2’를 개발 중이다. 더욱 긴 입력에 대한 처리, 정교한 추론, 구조적 효율성 등 다수 영역서 성능 향상을 꾀한다.
다양한 모델의 오픈소스 공개도 이어가고 있다. 지난 24일에는 국내 공개 모델 중 최고 성능을 갖춘 경량 멀티모달 언어모델과 MoE(상황에 맞춰 전문가에게 맡기는 방식) 모델을 오픈소스로 공개하며 자체 AI 기술개발 능력을 재차 입증했다.
시각물, 문서 입력 시 자연어로 응답하는 멀티모달 언어모델 ‘카나나-1.5-v-3b’는 경량형임에도 한국어‧영어 문서 이해 능력이 오픈AI의 ‘GPT-4o’와 견줄 수 있을 정도로 뛰어나다. 지시 이행 능력 평가에선 국내 공개된 유사 규모 멀티모달 언어모델 대비 128% 높은 성능을 기록하기도 했다.
MoE 구조 언어모델은 일반 모델보다 컴퓨팅 자원 활용 및 비용 절감 효과가 뛰어나다. 실제로 MoE 구조를 적용한 ‘카나나-1.5-15.7b-a3b’는 추론 시 활성화하는 파라미터가 3B에 불과하지만, 성능은 ‘카나나-1.5-8B’와 동등하거나 상회하는 수준을 기록했다.
카카오 관계자는 “(컨소시엄의) 구체적인 참여사들을 밝힐 순 없지만, 경쟁력 있는 협력업체들을 다수 확보했다”며 “글로벌 수준 초거대 모델 개발에 도전함으로써 국내 AI 생태계 자립성과 기술 경쟁력 강화에 기여할 것”이라고 밝혔다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지