[더테크=조명의 기자] 업스테이지가 삼성생명에 공급한 금융 특화 AI 광학문자인식(OCR) 솔루션이 업계 1위의 정확도를 달성했다. 문서 자동화 난이도가 가장 높다고 알려진 보험업계에서 문서 자동화를 실현했다는 평가가 나온다.
25일 업스테이지에 따르면 지난 4월 삼성생명에 공급한 AI OCR 솔루션 ‘다큐먼트 AI’의 문서 인식률이 평균 95점 이상의 정확도를 보였다. 두 회사는 진료비 영수증 등 보험청구 서류 7종 문서를 대상으로 OCR 인식률을 검증한 결과, 평균 95%에 달하는 정확도를 추출하며 당초 목표치 90%를 초과 달성했다.
OCR은 이미지 내 문자를 텍스트 데이터로 추출하는 AI 기술이다. 이미지의 형태에 따라 난이도가 달라진다. 보험 서류 처리는 최고 난이도로 꼽힌다. 진료비 영수증의 경우 병원마다 문서 양식이 다르고 손글씨 등 비정형 데이터가 많기 때문이다. 타사 OCR 모델의 인식률이 통상 80점대에 머무는 이유이기도 하다.
업스테이지는 자사 OCR 모델의 인식률이 90점 중후반대를 기록해 사람이 별도로 수정해야 할 항목은 4% 내외에 불과, 상당 부분 자동화가 가능한 수준임을 확인했다고 전했다.
이러한 결과는 모델의 범용성이 주효했다는 설명이다. 다큐먼트 AI는 사전학습 모델을 기반으로 신규 데이터만 추가로 학습하면 다양한 형태의 문서를 처리할 수 있다. 약제비 영수증 항목에서만 삼성생명 데이터를 활용하고, 나머지 6종 문서는 기본 모델만 구동해 평균 95% 이상의 인식률을 달성했다.
앞으로 업스테이지는 삼성생명과 협력을 강화하고 보험 청구 문서 확장 등 OCR 적용 영역을 넓혀나갈 예정이다. 나아가 보험업계 성공 사례를 기반으로 은행 등 금융권과 무역, 유통, 교육 등 다양한 산업 분야에서 AI OCR 확대를 추진한다는 계획이다.
김성훈 업스테이지 대표는 “세계적인 수준의 업스테이지 AI OCR 기술력을 국내 1위 생명보험사인 삼성생명과의 협업에서 인정받게 되어 기쁘다”며 “앞으로 업스테이지는 금융뿐만 아니라 다양한 도메인에 특화된 AI 솔루션으로 기업들의 디지털 전환을 지원할 것”이라고 밝혔다.