AI업계 "생성형 AI, 학습 데이터 편차 따라 국가별 역사 인식 왜곡 가능성 커"

오픈AI 로고 사진로이터 연합뉴스
오픈AI 로고 [사진=로이터 연합뉴스]



생성형 인공지능(AI)의 잘못된 역사 사실 제공 논란이 좀처럼 수그러들지 않고 있다. 한중, 한일 등 국가 분쟁 관련 질문 시 데이터 양과 알고리즘에 따라 일부 편향적인 답변 혹은 국가 관련 왜곡된 정보가 여전히 생성되는 경우가 반복되고 있다. 

12일 AI업계에 따르면 오픈AI, 구글, 그록 등 주요 생성형 AI 기업들은 국가별 데이터 투입량을 공개하지 않고 있다. 다만 대규모다중작업언어이해(MMLU) 점수를 통해 추정할 수 있는데, 점수가 가장 높은 영어 기반 학습 데이터가 양과 질 모두 가장 우수하다.

아시아권에서는 일본어 데이터 활용이 가장 활발해 검색 시 알고리즘상 월등히 활용될 가능성이 크다. 반면 한국어 데이터 투입량은 비교적 적고, 콘텐츠 활용 능력도 다른 언어 대비 부족하다는 분석이 나온다.

백은경 이화여대 인공지능대학원 교수는 “역사적 사실과 같은 자료를 찾을 때 생성형 AI가 알고리즘의 가중치와 접하는 데이터에 따라 답변이 달라질 수 있다”며 “생성형 AI가 학생이라면, 사용자는 선생님처럼 더 다양한 데이터를 제공해야 한다”고 말했다.

AI의 데이터 학습 능력은 사람과 유사하다. 학생이 만나는 선생님에 따라 배우는 내용이 달라지듯이, AI도 학습 데이터와 알고리즘에 따라 결과가 달라질 수 있다. AI가 학습하는 데이터가 어떤 국가에서 생성된 것인지, 알고리즘이 가중치를 어떻게 설정하느냐에 따라 편향된 결과가 나올 수 있다는 것이다.

실제로 일본, 중국 등의 역사 교과서가 자국 중심으로 서술되어 있듯이, AI가 학습하는 데이터도 각국의 정치적·문화적 배경에 따라 편향될 수 있다. 백 교수는 “데이터 공개 제한 문제도 일부 있지만, 인구 규모나 문화 영향력 등 현실적 요인도 편향에 영향을 준다”고 설명했다.

AI 언어모델은 방대한 인터넷 데이터, 출판물, 학술 자료 등 다양한 출처에서 정보를 학습하지만, 공개된 데이터의 양과 질, 언어별 접근성에는 차이가 있다. 일본과 중국 관련 자료는 활발히 공개되고 있으며, 국내외에서 광범위하게 활용되는 반면, 한국어 데이터는 상대적으로 제한적이고 보안·저작권 문제로 인해 데이터셋에 충분히 반영되지 못하는 경우가 많다. 이로 인해 AI가 역사적 질문에 답변할 때 특정 국가 관점이 과도하게 반영되어 편향된 정보가 출력된다.

더욱이 AI 학습 알고리즘의 설계도 문제를 심화시킨다. AI는 데이터에서 패턴을 학습하는데, 데이터 분포와 가중치 설정에 따라 특정 정보에 더 높은 비중을 둘 수 있다. 이는 개발자 의도뿐 아니라 무의식적 편향, 혹은 국가별 자국 중심 데이터 강화 전략에 의해 발생할 수 있다. 결국 데이터와 알고리즘이 상호작용하며 AI의 지식 정확도와 편향 문제를 복합적으로 만들어낸다.
 
그래픽아주경제
그래픽=아주경제


최병호 고려대 교수는 AI의 편향 문제에서 ‘의도성’에 대해 주의를 당부했다.

최 교수는 “일론 머스크가 최근 자사 그록 시스템 프롬프트를 조작하도록 지시해 특정 질문에 대해 답변을 제한하거나 왜곡된 내용을 반복해서 출력했다는 얘기도 나왔다”며 “예컨대 ‘동해’를 묻는 질문에 ‘일본해’라고 답하도록 하는 등 시스템 프롬프트에 특정 메시지를 넣어 출력하도록 조작할 수 있다”고 설명했다.

이는 AI가 단순히 학습 데이터에 의한 편향뿐 아니라 개발자 혹은 운영자의 의도에 따라 결과를 조정할 수 있음을 시사한다.

이와 같은 의도성은 AI 편향 문제를 한층 복잡하게 만든다.

최 교수는 “이런 경우는 단순한 알고리즘 오류나 데이터 편향과는 다르다”며 “의도적으로 시스템 프롬프트를 조작하는 행위는 AI가 특정 방향으로 답변하도록 ‘강제’하는 것”이라고 덧붙였다.  AI가 공정하고 정확한 정보를 제공하기 위해서는 단순히 데이터 양과 알고리즘 성능을 높이는 것뿐 아니라, 시스템 설계 및 운영 과정에서의 투명성과 책임성이 반드시 확보돼야 한다는 분석이다. 

일각에서는 MMLU 평가 지표에서 나타나는 한국어 데이터 부족 문제도 편향을 심화시킨다고 지적한다. 일본어나 중국어 데이터가 풍부하고 다양한 상황에서 학습된 AI는 높은 점수를 받지만, 한국어 데이터는 상대적으로 적고 제한적이라 점수가 낮은 경향이 있기 때문이다. 이는 AI가 한국 관련 역사적 사실에 대해 충분하고 균형 잡힌 정보를 제공하는 데 어려움을 초래한다. 

업계 관계자는 “국가별 MMLU 점수와 정보 전달 왜곡이 직접적인 인과관계라고 말하기는 어렵다”면서도 “이미지 생성 영역에서는 일본에서 투입된 데이터 양이 더 많아 이런 결과가 나타나는 것으로 추정된다”고 설명했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기