포티투마루, 복잡한 서식 인식 솔루션 선보여

  • 인공지능 OCR-NLP 솔루션 '텍스탠딩' 출시

  • AI 딥러닝 키밸류 추출로 효율성 크게 개선

  • 계약서, 진단서, 금융 및 법률 등 다양한 문서 처리

[포티투마루 로고]

[데일리동방] 인공지능(AI) 스타트업 포티투마루가 PDF나 사진 파일로 저장된 복잡한 문서를 93%까지 인식하는 솔루션을 선보였다.

포티투마루(42Maru, 대표 김동환)는 인공지능 광학문자인식-자연어처리(OCR-NLP) 솔루션 ‘텍스탠딩’을 출시했다고 28일 밝혔다. 

텍스탠딩(Textanding)은 문서를 의미하는 Text와 이해(Understnading)를 합성하여 만들었다.

텍스탠딩은 문서내 글자를 인식할 수 있는 광학문자인식(OCR)과 인식한 기호를 우리가 사용하는 언어로 바꿔주는 자연어처리(NLP)기술을 인공지능 기술을 통해 획기적으로 개선한 솔루션이다.
 

[포티투마루 텍스탠딩]

기존의 OCR-NLP기술은 문서의 양식이 달라지거나 점, 오염, 구겨짐, 수기 문자 등을 잘못 이해하는 경우가 많아 수작업이 많이 필요했다.

특히 표와 같은 경우 사람은 가로와 세로를 비교하여 원하는 데이터를 금방 찾아내지만, 기존의 솔루션은 여러개의 검색 결과를 보여주거나 찾지 못하는 경우가 많았다.

포티투마루의 텍스탠딩은  인공지능 기술을 이용해 다양한 서식을 자동으로 인식하고 수정 및 교정, 분류할 수 있다.  따라서 별도의 수작업을 대폭 줄인 것이 특징이다.  

또, 새로운 문서를 처리하려면 지금까지는 프로그래머를 불러 추가해 시간과 비용이 많이 들었지만, 텍스탠딩은 별도의 프로그래밍 없이 사용자가 손쉽게 학습데이터를 구축하고 활용할 수 있도록 했다

포티투마루 관계자는 지난해 A은행이 자금세탁 방지 모니터링 프로그램에 자사의 AI OCR-NLP 솔루션을 구축했다고 밝혔다.

또, 현재 B제약사와 C공제조합 등에서 텍스탠딩으로 외주검사 성적서 및 계약서 등의 검토와 분류, 핵심 데이터 추출, 오타교정 등의 작업을 자동으로 수행 중이라고 덧붙였다.

포티투마루 관계자는 진단서, 영수증, 거래명세서를 비롯한 각종 금융 서식 및 법률 문서 등에도 적용이 가능해 사용처가 늘어날 것으로 기대했다. 
 
김동환 포티투마루 대표는 “텍스탠딩은 한 번 학습한 문서의 핵심 항목은 100% 인식이 가능하기 때문에 신규 추가 양식의 학습에만 집중하면 된다”며 “비정형 자료의 데이터 추출시 평균 93% 이상의 정확도로 자동 구조화가 가능하고, 학습 기반의 딥러닝 기술로 인식률과 정확도, 대상 문서 범위 역시 지속적으로 확대될 예정”이라고 말했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기