[AI, 말을 걸다] ① 사람처럼 알아듣고 말하는 인공지능, 대화형 AI 시대

기자정보, 기사등록일
이상우 기자
입력 2022-03-28 00:00
    도구모음
  • 글자크기 설정
  • AI, SW, HW 기술 융합으로 대화하듯 소통

  • 2026년 시장 22조원 이상...활용 가능성 커

  • 대화와 상담 이뤄지는 모든 서비스에 적용 가능

  • 수어 등 행동 인식도 기대...서비스 접근성 높여

최근 인공지능(AI) 챗봇 이루다가 서비스를 재개하면서 대화형 AI 활용에 대한 기대도 커졌다. 이루다는 20대가 주로 쓰는 일상 언어를 자유롭게 쓰는 것이 가장 큰 특징이며, 딱딱한 이미지의 AI를 자연스럽고 친근하게 만들었다.

AI와 깊이 있는 토론을 하는 것은 아직 이르지만 서비스 영역에서 사용자가 AI에게 원하는 것을 이해시키는 수준에는 이미 도달했다. 특히 단순 명령어를 인식하는 것을 넘어 사용자와 대화하며 맥락을 파악하고 맞춤형 서비스를 제공하기도 한다. 대화형 AI는 이처럼 개인화한 내용으로 인간과 자연스럽게 소통하는 AI를 말한다.

대화형 AI란 하드웨어, 소프트웨어 등을 통해 인간이 사용하는 '자연어'로 인간과 대화하는 일련의 기술을 말한다. AI, 메시징 애플리케이션, 자연어 인식 등 기술을 통합해 대화하는 소프트웨어를 흔히 '봇'이라고 하며, 텍스트를 사용하는 봇을 '챗봇', 음성을 사용하는 봇을 '보이스봇' 등으로 부른다.
 

대화형 AI 서비스 이루다가 올해 3월 베타 서비스를 시작하며 서비스를 재개했다. [사진=이루다 페이스북 갈무리]

한국전자통신연구원(ETRI)은 2020년 12월 발표한 보고서에서 코로나19 이후 주목해야 할 7대 기술 중 하나로 대화형 AI를 꼽았다. 모든 것이 디지털화하는 세상에서 자율적으로 작동하는 사회 시스템을 위해 AI를 통한 무인화는 필수적인 요소로 자리 잡을 전망이다.

이를 구성하는 개별 기술은 이전까지도 존재했지만 각 기술이 융합하면서 이전보다 사용자 친화적인 기술로 발전했다. 음성인식 엔진(Speech to Text)은 사용자 목소리를 텍스트로 변환해 자연어 처리 AI에 전달하고, AI는 발화의 맥락을 파악해 필요한 정보와 서비스를 검색한다. 음성합성 엔진(Text to Speech)은 AI 목소리를 만들어내 사용자에게 정보를 전달한다.

특히 심층학습 모델은 반복된 대화를 통해 개별 사용자 맞춤형 AI를 구축하고 최적화한 정보를 전달한다. 나아가 AI로 가상인간을 만드는 '디지털 휴먼' 기술과 더해지면 단순 텍스트나 음성을 넘어 사람 모습을 한 AI와 대화하는 서비스도 가능하다.

시장조사기관 마켓앤마켓이 발표한 자료에 따르면 전 세계 대화형 AI 시장 규모는 2021년 68억 달러(약 8조3330억원)에서 2026년 184억 달러(약 22조5482억원)로 연평균 21.8% 성장할 전망이다.

특히 코로나19로 인한 비대면 서비스 확대는 대화형 AI 시장의 주요 성장 동인으로 꼽힌다. 팬데믹(세계적 대유행)으로 소비자의 서비스 수요가 크게 늘어난 반면 기업이 사용할 수 있는 직원 수는 감소했다. 특히 고객센터 등 공간이 폐쇄되면서 소비자 대응이 느려지고, 이는 소비자 경험에 큰 영향을 미쳤다. 

대화형 AI는 이러한 환경에서 큰 역할을 한다. 가령 노르웨이 노동복지국은 코로나19 확산 초기 확진자가 급증하는 과정에서 27만건가량의 문의를 자동화해 처리했으며, 노르웨이 은행(SpareBank 1 SR-Bank)은 확진 고객에 대해 주택 대출 유예 절차를 자동화했다. 프리미엄 렌터카 서비스 아우디 실버카는 가상 직원을 통해 일관된 서비스 경험을 소비자에게 제공했다.

코로나19 기간 동안 AI 기반 챗봇에 대한 수요가 증가하고, 소비자 참여에 대한 관심이 커지면서 대화형 AI 시장 내 다양한 분야에서 활동하는 기업에 기회를 제공할 것으로 내다봤다. 다만 챗봇과 가상 도우미의 정확성 개선과 함께 서비스 안정성 확보를 통한 비즈니스 연속성 유지는 대화형 AI 시장에 주요 과제로 떠오를 전망이다. 이 밖에도 기업이 대화형 AI 솔루션에 대해 정확히 인식하고, 소비자 의도를 식별하는 것이 필요하다.
 
​상품추천 넘어 메타버스까지...플랫폼 넘나드는 대화형 AI

[사진=게티이미지뱅크]

대화형 AI는 이름 그대로 대화를 입출력 인터페이스로 사용하는 기술이다. 때문에 대화를 기반으로 하는 모든 일상 서비스에 접목 가능하다.

AI 솔루션 기업 솔트룩스 관계자는 "상담이 이뤄지는 모든 곳에 적용될 수 있을 것"이라며 "시작은 금융권 콜센터에서 업무 외 시간에 상담 채널용으로 본격 도입됐고, 최근에는 대민 서비스가 필요한 공공기관에서도 도입이 늘고 있다"고 말했다.

마이크로소프트는 대화형 AI에 대해 사용자 인터페이스를 통해 인간과 소통하는 애플리케이션이라고 정의했다. 이는 이미 소비자, 환자, 학생, 직원 등 다양한 산업 영역에 도입돼, 사용자가 답을 얻거나 문제를 해결하는 데 도움을 주고 있다.

고객 서비스 분야에서 대화형 AI는 개인 맞춤형 서비스를 제공한다. 전자상거래 분야에서는 주문과 결제, 반품 처리 등을 자동화할 수 있다. 금융 분야에서는 계좌 잔액이나 거래 명세서를 확인하고, 신규 계좌 개설이나 해지 등의 서비스를 자동화할 수 있다. 환자 서비스에서는 증상에 맞춰 가까운 병원이나 약국을 안내하고, 방문 예약이나 환자 증후 평가(문진)에도 적용할 수 있다. 직원 서비스 분야에서는 기업용 계정 비밀번호 찾기 등 단순한 IT 업무부터 시작해 잔여 휴가를 확인하거나 성과·복지에 대한 정보 및 적용 가능 여부도 파악할 수 있다.

상품이나 서비스 추천도 가능하다. 예를 들어 이름이 어려운 보험 상품의 경우 상담사가 직접 소비자와 대화하며 필요한 상품을 소개한다. 인간 상담사는 '아들 운전연습 때문에 보험을 며칠만 가입할 수 있느냐'는 질문을 이해하고 '단기 운전자 확대 특약' 같은 상품을 추천한다.

정해진 키워드에 반응해 고정된 응답을 하는 '트리 로직(Tree Logic)' 방식 챗봇은 자신에게 맞는 보험 상품을 찾기 위해 여러 단계의 응답을 거쳐야 하며, 결국 인간 상담사를 찾게 된다. 이 과정에서 소비자 경험이 훼손된다. 반면 심층학습을 통해 소비자 발화 맥락을 이해하고, 상황에 맞는 상품이나 정보를 제공한다. 특히 초거대 AI와 새로운 학습 모델의 등장은 자연어를 넘어 제스처나 수어, 비명 같은 비언어적 소통 수단도 인식해 서비스를 제공할 전망이다.

이루다를 개발한 스캐터랩 관계자는 "향후 대화형 AI가 다양한 영역에서 사용자와 접점을 넓힐 수 있도록 고려하고 있다. 특히 텍스트를 통한 접점을 넘어, 사용자가 메신저로 보낸 움짤(움직이는 이미지), 사진, 동영상 등을 이해하고 답할 수 있도록 이루다를 학습 중"이라며 "사용자와 함께 게임을 하거나 선물을 주고받는 등 친구 같은 존재로 성장하길 바란다"고 말했다.

오픈타운을 개발한 마인드로직은 대화형 AI가 메타버스 서비스에서 중요한 역할을 할 것으로 기대했다. 사용자가 구축한 AI가 다양한 메타버스 서비스에서 독자적으로 활동하며 다른 사람 혹은 AI와 서로 소통하며 성장할 것이라는 전망이다.

오픈타운 관계자는 "향후 사용자는 누구나 자신의 전문성과 색깔을 살린 분야에서 깊이 있는 대화를 할 수 있는 대화형 AI를 구축할 수 있을 것으로 기대된다. 오픈타운은 자신이 만든 소셜 AI로 타인과 소통하고, 나아가 AI 모델을 거래하는 등 수익을 창출할 수 있는 플랫폼으로 키울 계획"이라고 말했다.
 

대화형 AI 시장 전망 [그래픽=임이슬 기자]


©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
2024_5대궁궐트레킹
실시간 인기
기사 이미지 확대 보기
닫기