딥시크, 기술력 인정 받았다...연구진 논문 '네이처 표지' 장식

  • '강화학습'으로 고난도 추론 성능 구현

  • 훈련비용 4억원...경쟁모델比 수백배 저렴

딥시크
딥시크의 AI 모델 ‘R1’의 개발 과정을 담은 논문이 네이처 18일자(645호) 표지논문으로 실렸다. [사진=네이처]


연초 전 세계에 '딥시크 쇼크'를 몰고 왔던 중국 인공지능(AI) 스타트업 딥시크 연구진의 논문이 세계적인 학술지 네이처 표지를 장식했다.

중국 정보통신(IT) 전문지 36Kr 등에 따르면 딥시크의 AI 모델 ‘R1’의 개발 과정을 담은 논문이 네이처 18일자(645호) 표지논문으로 실렸다. 네이처는 논문 추천사를 통해 “딥시크 연구진이 최소한의 인간 개입으로(입력값)으로 추론 모델을 학습시키는 방법을 공개한다”고 논문을 소개했다. 량원펑 딥시크 창업자는 이번 논문의 교신저자로 참여했다.

R1은 지난 1월 세계를 깜짝 놀라게 하며 등장한 고성능·저비용의 추론 특화 모델이다. 오픈소스로 공개된 R1은 세계 최대 AI 오픈소스 플랫폼 허깅페이스에서 최근까지 다운로드수 약 1090만 건을 기록하며 올해 가장 인기 있는 AI 모델로 등극했다. 

논문에 따르면 딥시크는 ‘강화학습’만을 사용해 R1을 훈련시켰다. 챗GPT와 같은 거대언어모델(LLM)의 훈련방식이 문제 풀이 방법을 미리 알려주는 ‘지도학습’이라면 강화학습은 AI가 스스로 답을 찾으면 보상을 하는 방식으로, 단계별로 문제를 해결하고 문제에 답하기 전에 스스로 검증하며 정답에 도달할 가능성을 높인다. 즉 모델의 성능이 인간이 제공한 예시의 수준에 갇히는 한계를 뛰어넘을 수 있다는 장점이 있다. 연구진은 강화학습을 통해 R1이 과학·기술·공학·수학(STEM) 등 고난도 추론 과제에서 우수한 성능 달성할 수 있었다고 설명했다. 

연구진은 논문 보충 자료를 통해 R1 훈련 비용을 최초로 공개하기도 했다. 29만4000달러(약 4억원). R1 구축 기반인 기본 LLM을 만드는 비용 600만 달러를 추가하더라도 경쟁 모델의 훈련 비용보다 훨씬 낮은 수준이다. 반면 오픈AI와 구글  등의 AI 모델 훈련 비용은 수천만 달러에 달한다. 딥시크는 R1이 주로 2023년 대중(對中) 수출이 금지된 엔비디아의 H800으로 훈련됐다고 덧붙였다. 

네이처는 별도로 실은 논평 기사를 통해 딥시크의 성과를 극찬했다. 네이처는 "(논문은) 중국 스타트업이 약 30만달러에 어떻게 시장을 뒤흔든 LLM을 만들었는지 보여줬다"며 딥시크는 R1의 성공이 경쟁사의 결과물을 기반으로 학습해 얻은 것이 아니라는 점을 증명했다고 평가했다. 딥시크는 R1 공개 직후 오픈AI의 모델을 무단 활용했다는 의혹을 받는 바 있다. 

이번 논문은 대규모 언어모델 연구가 네이처와 같은 학술지의 동료심사를 거쳐 발표된 첫 사례이기도 하다. 이 논문의 심사자 중 한명인 허깅페이스의 루이스 턴스톨 연구원은 "연구개발(R&D) 과정 전반을 공개적으로 공유하는 업계 규범이 없다면 모델의 잠재적 위험성을 평가하기 어렵다"며 “이는 매우 환영할 만한 선례”라고 말했다. 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기