NC AI, 경량급 최강 VLM '바르코 비전 2.0 1.7B' 모델 공개

출처NC AI
[출처=NC AI]
NC소프트의 인공지능(AI) 연구 조직인 NC AI가 전 세계 최고 성능의 초경량 멀티모달(텍스트‧이미지‧음성‧영상 등 동시 처리) 시각·언어모델(VLM)을 개발했다.
 
NC AI는 온디바이스(기기 자체 AI 수행) 환경서 구동 가능한 초경량 멀티모달 AI 모델 ‘바르코 비전 2.0’ 1.7B(매개변수 십억 단위)를 공개했다고 30일 밝혔다.
 
이는 시각물‧문서를 함께 이해해 질문에 답할 수 있는 차세대 AI 모델이다. 여러 장 이미지를 동시에 분석할 수 있어 복잡한 문서나 표 등도 효과적으로 처리할 수 있다.
 
문서 처리, 한국어 성능에선 동급 최고 모델임을 입증했다. 영문 문서 처리 ‘MT-벤치’와 한국어 ‘K-시드’를 비롯한 광학문자 판독 ‘코드’, ‘문서분석 및 인식국제학술회의(ICDAR)’ 등 다양한 평가 지표서 글로벌 모델 성능을 훌쩍 넘었다.
 
대학 수준 지식을 검증하는 ‘MMMU’, 과학 지표 시각물 해석 능력을 평가하는 ‘AI2D’ 등에선 카카오 ‘카나나 3B’, 네이버 ‘하이퍼클로바 3B’ 등 3B급 멀티모달 모델들과 동등하거나 뛰어난 성능을 보였다.
 
시각적 맥락에서의 수학적 추론 능력을 평가하는 매스비스타(MathVista), 멀티모달 AI의 종합 시각언어 기능을 평가하는 ‘MM-벳’에서도 윗 체급 모델들 사이에서 2위를 기록했다. NC AI는 “모델 크기가 성능을 결정하는 절대적 요소가 아니라는 것을 보여준 사례”라고 설명했다.
 
1.7B 매개변수 경량 모델은 스마트폰, PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다. 사용자 자료가 외부 서버로 전송되지 않아 사생활이 완벽하게 보호된다. 네트워크 연결 없이도 즉시 AI 기능을 사용할 수 있다. 이번 모델도 개방형(오픈소스)으로 공개한다.
 
이연수 NC AI 대표는 "NC AI가 보여준 경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것"이라며 "앞으로도 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다"고 밝혔다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기