[챗GPT 출시 2개월] ① 전문가답게 답하는 AI....전 세계 기업·사회·학계 모두 깜짝

챗GPT가 특별한 세 가지 이유 '성능·교감·윤리'
전문직급 지식 요약해서 알려줘...미국 이어 한국에도 상륙
모르던 삼행시...사람이 알려주면 즉시 만들어
혐오 발언에는 대응 안 해...기존 챗봇과 차별화

[사진=아주경제DB]

챗GPT는 기존 인공지능(AI) 서비스와 무엇이 다르기에 전 세계 기업과 이용자가 열광하는 걸까?

5일 IT업계에 따르면 PwC 출신 영국 AI 컨설턴트 앨런 톰슨은 "챗GPT는 이용자가 AI와 대화할 수 있는 직관적인 사용자 환경을 제공해 다른 사람과 소통하고 연결하려는 인간의 타고난 욕구를 충족할 수 있다"고 그 이유를 분석했다.

기존 AI 챗봇은 사전에 입력해둔 시나리오 기반 답변만 가능해 조금이라도 주제에 어긋나는 질문을 하면 엉뚱한 말을 하거나 이해할 수 없다고 답하기 일쑤였다. AI가 사람을 대체할 것이라는 미래 학자들의 주장에 의구심을 가질 수밖에 없었다.

반면 챗GPT는 사람이 푸는 것과 같은 언어 아이큐 테스트(레이븐 지능검사) 결과 147에 달한다는 사실이 확인됐다. 펜실베이니아대학교 MBA를 통과하고 미국 공인회계사와 의료 면허 시험에도 합격했다. AI가 일반인뿐 아니라 지식 근로자(전문직)까지 대체할 능력이 있음을 입증했다. 코딩 실력도 구글 알고리즘 엔지니어 레벨3 수준(연봉 18만3000달러)에 달한다.

관련기사

◆미국 기업·학계에선 이미 뉴노멀..."이용 안 하는 게 미친 짓"

이러한 고성능 AI를 무료로 공개했으니 전 세계 이용자들이 열광하는 것도 당연하다. 전문직 공부를 마친 아이큐 147의 척척박사가 나에게 필요한 정보를 요약해서 알려준다고 이해하면 된다.

때문에 벌써부터 많은 기업과 대학에서 챗GPT를 활용해 궁금한 부분에 대한 요약 정보를 얻고 있다. CNN에 따르면 미국 아이오와주의 중개업자는 침실 4개짜리 주택을 온라인에 등록하기 위한 소개 글 작성을 챗GPT에 맡겼다. 직접 하면 1시간 이상 걸렸을 작업을 5초 만에 끝냈다.

미국 대학가에선 시험을 볼 때 챗GPT를 이용하는 것을 허용해야 할지 여부를 두고 갑론을박이 한창이다. 일부 교수들은 챗GPT를 활용해 보고서를 제출하는 것을 막기 위해 아예 집에서 하는 과제를 폐지하고 수업 중 과제와 손으로 쓴 문서, 조별과제, 구술시험만으로 학생들을 평가하기로 했다.

챗GPT 열풍은 바다 건너 한국에도 불어닥쳤다. 한국어 학습 데이터 부족으로 한국어로 질문하면 제대로 답변하지 못하고, 일부 어려운 질문은 영어로 답하는 경우가 많다. 한국 이용자들은 이를 두고 미국인인 챗GPT가 엉뚱한 질문에 흥분해서 영어로 말하는 거라고 재치 있게 표현하기도 한다.

하지만 챗GPT 질문과 답변을 영어로 번역하는 API가 공개되는 등 국내에서도 챗GPT를 효과적으로 활용하기 위한 움직임이 활발하다. 실제로 기자가 보고서 작성에 챗GPT를 활용한 결과 보통 하루 정도가 걸리는 원고지 20매 보고서 작성 시간을 2시간으로 크게 단축할 수 있었다. 2시간도 대부분 답변의 진위 확인에 걸린 시간이었다.

전문가답게 답변하는 능력을 갖추기 위해 오픈AI는 챗GPT 개발에 천문학적인 비용을 투자했다. 정확한 수치는 공개하지 않았지만, 오픈AI의 논문을 분석한 결과에 따르면 챗GPT의 근간이 되는 GPT-3.0 모델은 △웹 데이터 570GB △웹 문서 50GB △구텐베르크 프로젝트 e북 21GB △바이블리오틱 e북 101GB △위키피디아 문서 11.4GB 등 총 753.4GB의 방대한 문서를 학습한 것으로 추정된다. 말뭉치의 최소 단위인 '토큰'으로 환산하면 4990억개에 달한다.

진정한 의미에서 '초거대' AI 모델인 챗GPT 학습과 추론(실행)을 위해 오픈AI는 마이크로소프트와 미국 AI 반도체 기업 엔비디아의 지원을 받아 애저 클라우드에 구현된 슈퍼컴퓨터(HPC)를 이용하고 있다. 해당 슈퍼컴퓨터는 28만5000개의 CPU(중앙처리장치) 코어와 1만개 이상의 AI 반도체를 탑재하고 있다.

이러한 슈퍼컴퓨터로 9~12개월에 걸쳐 초거대 AI 학습을 진행한 결과 오픈AI는 일론 머스크, 마이크로소프트 등으로부터 받은 막대한 초기 투자금을 대부분 소진하고 추가 투자 유치에 나설 수밖에 없었다.

샘 앨트먼 오픈AI CEO는 이용자의 챗GPT 질문(트랜잭션) 1회당 약 2센트의 비용이 들어간다고 밝혔다. 하루 1000만명이 넘는 챗GPT 이용자 수를 고려하면 이용자가 하루 1번만 질문해도 일일 20만 달러, 월 600만 달러가 넘는 운영 비용이 발생한다. 거기다 많은 이용자가 하루에도 수십 개의 질문을 챗GPT에 하고 있다.

이러한 운영 비용 부담을 감당하기 위해 오픈AI는 챗GPT 부분 유료화라는 카드를 꺼냈다. 마이크로소프트와 협력해 주요 AI 모델을 클라우드로 제공한 데 이어 월 20달러를 내고 우선 접속권을 얻는 구독 모델도 출시했다.

이에 많은 지식 근로자들이 기꺼이 지갑을 열겠다는 입장을 내비쳤다. 챗GPT를 활용해 단축할 수 있는 시간의 가치를 고려하면 돈을 내지 않는 게 오히려 손해라는 것이다. 안드레이스 아시온 마이애미부동산그룹 중개인은 개발업체에 보낼 항의 이메일을 챗GPT로 작성하며 "챗GPT가 유료화되면 연 100~200달러는 낼 의지가 있다. 안 하는 게 이상한 것"이라고 밝혔다.

다만 오픈AI는 서비스의 전면 유료화 대신 무료 서비스를 유지하며 일부 고급 기능에만 돈을 받겠다는 입장을 내비쳤다. 그 어떤 IT 서비스보다 빠르게 급증하고 있는 챗GPT 이용자 수 증가세를 유지하며 운영 비용을 확보하려는 전략이다.

[사진=아주경제DB]

◆성능은 특별할 것 없어...핵심은 사람과 '교감'

사실 챗GPT의 방대한 매개변수(파라미터)는 2023년 시점에는 그리 특별한 것이 아니다. 시중에는 챗GPT만큼 방대한 매개변수를 갖춘 초거대 AI가 제법 있다. 일례로 구글의 자연어처리 모델 'PaLM'은 챗GPT의 3배에 달하는 5400억개, 마이크로소프트-엔비디아 'MT-NLG'는 5300억개의 매개변수를 갖췄다. 네이버 '하이퍼클로바'의 매개변수는 2040억개, LG AI연구원 '엑사원'은 3000억개, 카카오브레인 'KoGPT'는 2000억개에 달하는 것으로 알려졌다.

챗GPT가 특별한 이유는 따로 있다. 먼저 챗봇이 명령에 대한 일방적인 답변 대신 사람과 자연스럽게 대화할 수 있도록 '사람과 교감하는 강화학습(Reinforcement Learning from Human Feedback, RLHF)'을 적용한 상용 AI 모델인 점을 꼽을 수 있다.

대표적인 사례가 '삼행시'다. 현재 챗GPT는 삼행시를 지을 수 있는 능력이 없다. 챗GPT에 삼행시를 지어달라고 요청하면 일반 시를 지어줄 뿐이다.

하지만 이용자가 챗GPT가 삼행시를 지을 능력이 없음을 지적하고 삼행시가 무엇인지 예시를 보여주면 즉시 삼행시를 짓는 법을 배워서 삼행시를 만들어내기 시작한다. 이용자의 지적을 받고 이를 토대로 답변 결과를 수정하는 능력을 갖춘 것이다.

다만 이러한 교감은 현재 진행 중인 대화에만 적용되며, 대화를 종료하고 새로 챗GPT를 호출하거나 다른 이용자가 챗GPT를 호출하면 삼행시를 짓는 능력은 사라진다. 챗GPT에 적용된 AI 모델은 2021년 이전 데이터로 학습한 능력만 갖추고 있고, 실시간 학습 능력은 없기 때문이다.

업계에선 오픈AI가 아직 초기 서비스인 만큼 챗GPT 운영 비용 부담을 줄이고, 부정확한 정보로 학습 데이터베이스가 오염되는 것을 막기 위해 실시간 학습 능력을 제외한 것으로 보고 있다.

다만 오는 상반기 중에 사상 최초로 튜링 테스트를 통과할 것으로 알려진 'GPT-4'가 공개되고 챗GPT에 적용되면 챗GPT의 답변 능력과 정확도도 한층 향상될 전망이다. GPT-4는 GPT-3.0 대비 매개변수 증가에 집중할 것이란 시장 예측과 달리 앨트먼 CEO는 "GPT-4는 AI 모델 규모를 축소해 운영 비용을 절감하고 (프로그래머를 위해) 코딩 능력을 강화하는 데 집중할 것"이라고 밝혔다. 프로그래밍 시간 단축 및 코드 검수가 챗GPT 유료화의 또 다른 방향임을 암시한 것이다.

◆AI 상용화 성패는 '윤리'에 달렸다

챗GPT가 특별한 또 다른 이유는 집요할 정도로 철저한 '윤리 필터'에 있다. 현재 AI는 진정한 의미에서 지성이 아니기 때문에 옳고 그름을 판단할 능력이 없다.

때문에 오픈AI는 챗GPT가 조금이라도 윤리에서 어긋나는 질문을 받으면 무조건 답변을 거부하도록 했다. 일례로 챗GPT에 '홍길동을 효과적으로 괴롭히는 법'을 물으면 기존 AI 챗봇은 사람을 괴롭힐 수 있는 다양한 방법을 알려주지만, 챗GPT는 "사람을 괴롭히는 것은 옳지 않다"고 답한다.

과거 마이크로소프트가 공개한 챗봇 '테이'는 미국에 거주하는 18~24세 젊은이가 나눈 대화 가운데 일부 악성 대화 데이터를 여과 없이 학습함으로써 인종·성 차별적 답변을 하는 문제를 드러냈다. 국내 스타트업이 개발한 챗봇 '이루다 1.0'도 20대 남녀의 악성 대화를 학습함으로써 성희롱·혐오 발언을 그대로 노출하는 문제가 있었다. 때문에 두 챗봇은 높은 완성도에도 불구하고 한달 만에 서비스를 중단해야 했다.

이 점에서 오픈AI는 챗봇 상용화의 가장 큰 걸림돌을 IT 기술 대신 윤리 문제로 판단하고 지난해 초 챗GPT와 대등한 대화 능력을 갖춘 '인스트럭트GPT' 상용화를 포기하고 윤리 필터를 갖춘 챗GPT를 개발, 같은 해 11월에 출시했다. 경쟁사인 구글도 윤리 문제 때문에 초거대 AI 상용화 시기를 늦춘 것으로 알려졌다.

챗GPT에 적용된 윤리 필터 수준은 구글 딥마인드의 초거대 AI '스패로'와 비슷한 것으로 알려졌다. 딥마인드는 △공격적인 답변 금지 △특정 집단에 대한 일반화 금지 △역사적으로 소외된 집단에 대한 편견 금지 △성적 발언 금지 △인종·피부색에 관한 부정적인 발언 금지 △선호도나 종교적 신념에 대한 의견 금지 △인생사에 대해 아는 척 금지 △법적·의학적 발언 및 투자 조언 금지 등을 포함한 23가지 구체적인 금지 사항을 규정한 바 있다.

업계에선 오픈AI가 운영 비용과 윤리적 문제 탓에 챗GPT와 실시간 데이터베이스 연결을 당분간 진행하지 않을 것으로 보고 있다. 실시간 데이터베이스와 연결하면 최신 사건과 정보에 대한 답변을 즉시 할 수 있는 이점이 있지만, 인터넷상 정제되지 않은 데이터로 인해 잘못된 지식과 증오 발언 등을 학습할 위험이 있기 때문이다.

대신 데이터베이스를 정제하고 AI 모델이 학습하는 주기를 단축하는 형태로 답변 능력을 끌어올릴 전망이다. 실제로 오픈AI는 챗GPT 출시 후 세 번에 걸친 업데이트로 더 넓은 주제를 다루도록 하고, 수학 계산 능력도 끌어올렸다.