ETRI, 韓·美·中·日 등 9개 언어 음성인식→문자변환 기술 개발 성공

기자정보, 기사등록일
입력 2017-04-18 14:53
    도구모음
  • 글자크기 설정

ETRI 연구원이 음성인식 기술을 기반으로 만든 자동통역 앱 '지니톡'을 시연하는 모습[사진=ETRI]

아주경제 권지예 기자 = 음성이 문자로 변환하는 세상이 가능해졌다. 한국전자통신연구원(ETRI)은 국내 연구진이 한국어, 영어 뿐만 아니라 일본어, 중국어 등 9개 언어 처리가 가능한 음성인식기 개발에 성공했다고 18일 밝혔다. ETRI는 사람의 음성을 실시간으로 문자로 변환 할 수 있는 기술이 사람들의 일상대화에서 언어별로 최대 95% 수준의 성능을 보여 상용화가 가능한 수준이라고 밝혔다.

연구진은 이 기술이 스마트폰을 비롯해 스마트 스피커, 스마트 홈 허브 기능을 가지는 셋톱박스, 냉장고, TV 등의 스마트 가전으로 음성인식 기술이 급격히 확산되고 있는 점을 고려할 때, 글로벌 시장 진출을 계획하는 국내 업체들에게 큰 도움이 될 것으로 기대했다.

음성인식기는 인공지능 기술의 한 분야인 딥러닝 기술을 바탕으로 대용량의 데이터를 이용해 개발됐다. 추후 빅데이터와 관련된 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등 다국어 음성언어처리 핵심기술도 확보해 추후 동남아, 힌디어 등 타 언어로 확대할 예정이다.

연구진에 따르면 이번 기술은 구글(Google) 등 세계 업체와 비교시 한국어에서는 성능 우위를 점하고 다른 언어에서는 대등한 수준이다. ETRI는 음성인식기가 향후 통역은 물론, 인공지능 비서, 방송의 자막화, 콜센터 서비스 등에 활용이 가능할 것으로 보고 있다.

서비스 방식은 클라이언트 서버형과 단말 탑재형 등으로 다른 기술들과 비슷하다. 또한 음성인식기는 응용 분야에 따라 한 번에 수명에서 수십명까지 동시 접속해 인식이 가능한 수준이다.

ETRI는 글로벌 시장을 동시에 공략해야 하는 최근의 음성인식 산업계 흐름을 감안할 때, 본 음성인식 기술을 이용해 인공지능 비서, 자동통역 서비스, 커넥티드 카 등의 주요 다국어 음성인식 관련 세계 시장에 동시 진출할 수 있을 것으로 전망했다. 향후 음성인식 기술은 필요로 하는 국내 이동통신업체를 비롯하여 주요 포털, 음성인식엔진 기술을 상용화하고 있는 기업체에 기술이전 될 예정이다.

김상훈ETRI 음성지능연구그룹 프로젝트 리더는 “향후 본 기술의 고도화를 통해 기술 경쟁력을 높이는 동시에, 지원 언어를 확대해 나가 국내 업체들의 글로벌 시장 진출에 있어 든든한 버팀목이 되겠다”고 밝혔다.

ETRI는 현재 본 기술을 내년 평창 동계올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께‘지니톡’자동통역 서비스에 적용해 시범서비스 중이다. 향후 2020년 동경올림픽 개최 시점까지는 대상 언어를 14개 언어로 확대하고, 추가적으로 20개 언어 이상으로 늘려 나갈 예정이다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기