업스테이지, 中 AI 표절 논란 일단락…배경훈 부총리 "韓 AI 밝은 미래 봐"

  • 지난 1일 고석현 사이오닉AI 대표 "업스테이지 中 모델서 파생" 주장

  • 김성훈 업스테이지 대표 즉각 반박…'통계적 착시'에 불과

지난 2일 김성훈 업스테이지 대표가 서울 강남구 사진업스테이지
지난 2일 김성훈 업스테이지 대표가 서울 강남구 한국과학기술회관 자사 모델에 대한 공개 검증에 나섰다. [사진=업스테이지]

국산 대표 인공지능(AI) 모델인 ‘업스테이지’의 기술적 진위 논란을 둘러싼 공개 공방이 사과와 검증으로 일단락됐다. 현업 종사자들은 국내 AI 생태계가 한 단계 성숙하는 계기가 됐다고 평가한다.
 
4일 관련업계에 따르면, 배경훈 부총리 겸 과학기술정보통신부(과기정통부) 장관은 전날 자신의 사회관계망서비스(SNS)에 "업스테이지 AI 모델 개발 방식의 독창성과 적절성에 대해 다양한 의견이 오갔다"며 "건전한 AI 생태계에서는 건강한 질문과 토론이 오간다"고 밝혔다.
 
이어 "AI 업계를 뜨겁게 달군 기술적 논쟁을 지켜보며 대한민국 AI의 밝은 미래를 봤다"며 "건전하고 투명한 기술적 토론이 활성화하는 공론의 장이 많아지면 AI 강국 도약을 위한 가장 강력한 자양분이 될 것"이라고 덧붙였다.
 
배 부총리는 그러면서 김성훈 업스테이지 대표와 고석현 사이오닉AI 대표에게 감사의 뜻을 전했다.
 
앞서 고 대표는 지난 1일 업스테이지가 '독자AI 파운데이션 모델(독파모) 프로젝트'를 통해 개발한 '솔라 오픈 100B'가 중국 지푸AI에서 파생된 모델이라고 주장했다.
 
고 대표는 "두 모델의 신경망 구성 요소 중 하나인 '레이어놈(LayerNorm)'을 비교한 결과 특정 구간에서 96.8%의 유사도가 나타났다"고 주장했다. 
 
이에 김 대표는 지난 2일 서울 강남구 한국과학기술회관에서 자사 모델에 대한 공개 검증을 진행하며 반박에 나섰다.
 
업스테이지 측은 레이어놈 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다고 설명했다. 해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역이라는 것이다.
 
솔라 오픈이 타 모델의 토크나이저(문장을 ‘토큰’ 단위로 쪼개는 전처리 도구)를 그대로 사용했다는 주장 역시 사실과 다르다는 입장이다. 중국 모델의 어휘 수는 약 15만 개, 솔라 오픈은 19만6000개로 실제 공통 어휘는 약 8만 개(41%) 수준이다. 동일 계열 토크나이저의 경우 일반적으로 70% 이상 어휘가 중복된다.
 
특정 모델의 소스코드를 가져와 라이센스를 조작했다는 의혹도 사실과 다르다고 강조했다. 회사 측은 더 많은 개발자가 솔라 오픈을 활용할 수 있도록 인퍼런스 코드를 공개했으며, 이 과정에서 서빙 호환성을 높이기 위해 허깅페이스에 공개된 오픈소스 코드베이스 일부를 활용했을 뿐이라고 밝혔다.
 
이후 3일 고 대표는 "해당 근거를 엄밀히 검증하지 않은 채 공개해 불필요한 혼란과 논란을 야기했다"며 "진심으로 사과드린다"고 밝혔다. 김 대표도 "사과는 언제나 어려운 일인데 용기를 내줘 감사하다. 업스테이지를 대표해 사과를 수용하겠다"고 화답하며 논란은 일단락됐다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

gigs2026
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기