글로벌 '생성 AI' 3파전…MS·구글 전쟁에 메타 가세

기자정보, 기사등록일
임민철 기자
입력 2023-02-26 15:40
    도구모음
  • 글자크기 설정
  • 오픈AI '챗GPT'로 거대 언어 모델 실용화 경쟁 촉발

  • MS '빙' 검색에 챗GPT 발전한 '프로메테우스' 적용

  • 구글도 2년 전 공개한 '람다' 기반 챗봇 적용 예고

  • 메타는 '라마' 공개…학계·시민사회와 협업 제안

  • 작은 모델 크기, 학술·연구 목적, 책임성에 초점

마크 저커버그 메타 CEO [사진=로이터·연합뉴스]

민간 인공지능(AI) 연구소 오픈AI의 '챗GPT' 출시가 촉발한 글로벌 빅테크 기업 간 생성(Generative) AI 기술 레이스가 오픈AI와 손잡은 마이크로소프트(MS)와 구글의 양강 구도에서 3파전 양상으로 확대된다. 생성 AI 기술 분야에서 MS와 구글이 격돌하고 있는 '거대 언어 모델(LLM)' 전쟁에 최근 메타(전 '페이스북')가 새로운 모델을 선보이며 가세했다.

26일 업계에 따르면 메타는 사내 AI 연구소 ‘메타AI(Meta AI, 전 FAIR)’에서 개발한 ‘라마(LLaMA·Large Language Model Meta AI)’를 공개했다. 라마는 앞서 등장한 다른 LLM과 마찬가지로 일련의 단어를 입력받아 이어질 단어를 예측하는 방식으로 자연스러운 문장과 텍스트를 생성하도록 만들어졌다.

마크 저커버그 메타 최고경영자(CEO)는 “LLM은 텍스트 생성, 대화, 문서 요약부터 수학 정리(theorems)를 풀거나 단백질 구조를 예측하는 것과 같이 더 복잡한 작업까지 활용될 가능성을 많이 보여 줬다”며 “메타는 이 개방형 모델 연구에 주력하고 있으며 이 모델을 AI 연구 커뮤니티에서 활용할 수 있게 할 계획”이라고 말했다.

메타가 오픈소스 커뮤니티 ‘깃허브(GitHub)’에 게재한 설명에 따르면 현재 제공되는 라마는 2022년 12월부터 2023년 2월까지 개발된 첫 버전(version 1)이며, 트랜스포머(transformer) 아키텍처 기반으로 제작된 ‘자기회귀(auto-regressive) 언어 모델’이다. 메타는 자사 AI 기술에 적용된 LLM을 외부 연구자에게 다양한 크기로 제공하고 이를 활용한 협력을 제안하며 효율성·개방성을 강조하고 있다. 이는 LLM 분야에서 앞서 기술을 공개하고 서비스를 출시한 MS·구글과 차별화하고 외부 연구자 커뮤니티와 시민사회를 우군으로 끌어들이기 위한 포석이다.

라마는 모델에 담긴 ‘매개변수(parameter)’ 개수에 따라 70억개, 130억개, 330억개, 650억개짜리로 나뉜다. 매개변수가 1000억개 이상인 MS와 구글 모델보다 상대적으로 크기가 작아 그만큼 외부 연구자들이 직접 수정·가공하기 용이하다. 매개변수는 모델의 연산 동작이 개발 목적에 가장 알맞은 결과를 내도록 조정되는 변수를 뜻하는데, 개수가 많을수록 모델 연산에 요구되는 컴퓨터 성능과 전력량, 모델 제작 소요 기간과 비용이 기하급수로 늘어난다.

MS와 구글은 최신 LLM의 원천 기술을 완전히 개방하지 않고 있지만 개방하더라도 그 규모는 대다수 개인·기업 연구자가 온전히 수정·가공해 다루기는 거의 불가능할 정도로 거대하다. MS 투자를 받은 오픈AI는 앞서 매개변수 1750억개를 다루는 언어모델 ‘GPT-3’와 이를 발전시킨 ‘GPT-3.5’를 기반으로 대화형 AI 서비스인 챗GPT를 만들었고, MS는 이를 업그레이드한 ‘프로메테우스’ 모델 기반 챗봇을 결합한 ‘새로운 빙(New Bing)’을 출시했다. 구글도 매개변수 1370억개를 품은 ‘람다(LaMDA)’ 모델을 공개한 지 2년 만에 이를 활용한 챗봇 ‘바드(Bard)’를 소개하고 조만간 검색 서비스에 탑재한다고 예고했다.

메타 AI 연구자들은 블로그를 통해 “LLM을 훈련하고 실행하는 데 필요한 자원 때문에 완전한 연구가 제한되고 이로 인해 LLM 작동 방식과 원인을 이해하는 연구자 능력이 제한돼 (AI의) 편향, 유해성, 오보(misinformation) 생성 가능성과 같은 문제를 줄이고 강건함(robustness)을 개선하는 작업의 발전을 저해한다”고 지적했다. 이어 “오용을 방지하기 위해 연구 목적에 초점을 맞춘 비상업적 라이선스(noncommercial license)로 우리 모델을 배포한다”며 “전 세계 학술 연구자, 정부, 시민사회, 학술 분야 단체와 산업계 연구실에 (사용권을) 부여하겠다”고 설명했다.
 

[그래픽=김효곤 기자]


©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기