[디지털투데이 김소연 인턴기자] 국내 연구진이 과학기술정보통신부와 정보통신기획평가원(IITP)이 추진하는 혁신성장동력 프로젝트인 `엑소브레인 사업'에서 개발한 최첨단 언어 인공지능(AI) 기술 상용화에 성공했다. 이로써 AI 비서, 자연어 질의응답, 지능형 검색, 빅데이터 분석 등 한국어를 활용한 인공지능 서비스 개발에 탄력이 붙을 전망이다.

한국전자통신연구원(ETRI)은 자연어로 기술된 키워드 및 질문을 입력받아 정확한 정답을 찾아주는 자연어 심층 질의응답 기술 `엑소브레인' 개발 및 상용화에 성공했다고 밝혔다.

본 기술은 단순히 문서를 찾아주는 웹 검색 기능이나 단답형으로 응답을 하는 수준을 넘어 고난도 서술형 질의응답이 가능하다. 이를 활용해 `일반상식 심층 질의응답 기술'과 `법령 지식 심층 질의응답 기술' 서비스를 개발해 상용화까지 이어졌다.

일반상식 심층 질의응답 기술은 기계가 문제 유형을 판별한 뒤 유형별로 최적화된 해법을 적용하여 위키백과를 분석해 정답을 찾아내는 방식이다. 본 기술에는 ▲한국어 질문분석 기술 ▲시맨틱 지식추출 기술 ▲위키피디아 기반 단답형·서술형 질의응답 기술 ▲질의응답 분산처리 플랫폼 기술 등이 적용됐다.

지난달 공개된 최신 ‘한컴오피스 2020’에 지식검색 기능으로 탑재됐으며, 한글의 도구 기능에서 오피스톡 선택, 우물정(#) 입력 후 질문하면 즉각 답변을 얻을 수 있다. 한글과컴퓨터사는 일반상식 분야 문제 대상으로 엑소브레인을 구글 지식그래프 검색과 비교한 결과, 엑소브레인이 최대 10% 이상 높은 성능을 보였다고 밝혔다.

'엑소브레인'을 법률 질의응답 시스템에 탑재해 시연하는 모습 (사진=ETRI)
'엑소브레인'을 법률 질의응답 시스템에 탑재해 시연하는 모습 (사진=ETRI)

또한 전문용어와 한자어가 많은 법률 분야에서 활용 가능한 수준의 심층 질의응답 기술 개발에도 성공했다.

예를 들어 “타인의 물건을 동의 없이 절취할 경우 성립되는 절도죄의 형벌은?” 질문에 대해 “6년 이하의 징역 또는 1천만 원 이하 벌금”과 같은 서술형 답변이 가능하다. 전문용어와 문장 내 어순의 맥락을 파악하기 위해 법령문서를 대상으로 특화된 딥러닝 언어 모델을 구축, 단답형 문제와 서술형 문제 유형 별로 최적화된 문제 풀이가 가능한 기계 독해 기술을 적용했다.

본 기술은 국회도서관과 국가과학기술연구회(NST)로부터 우수성을 인정받아 내년부터 양 기관의 인공지능 기반 법무 서비스를 위한 SW로 활용될 예정이다. NST는 간단한 법령 질문에 응대하고 전문가의 검색 및 답변 과정을 보조할 목적으로 활용한다.

ETRI는 지난 6월, 구글이 개발한 언어모델 버트(BERT) 대비 성능이 4.5% 우수한 코버트(KorBERT)를 개발해 공개한 바 있다. 코버트에 적용된 뉴럴검색(딥러닝 언어모델을 적용하여 검색 키워드들을 벡터의 값으로 표현하여 더욱 정확한 검색 결과를 찾는 정보검색 기술)과 기계 독해(MRC, 질문과 단락을 주고, 기계가 질문에 대한 정답을 찾는 것) 기술을 고도화하고 범용성을 확보하며 본 기술을 개발했다. 코버트는 공개 뒤 현재까지 331개 기관에서 활용이 이뤄지고 있으며, 엑소브레인 기계 독해 기술은 한국어 기계 독해 대회인 KorQuAD 1.0에서 95.02점으로 현재 1위를 차지하고 있다.

연구진이 개발한 코버트(KorBERT)와 구글 언어모델의 알고리즘 비교표 (자료=ETRI)
연구진이 개발한 코버트(KorBERT)와 구글 언어모델의 알고리즘 비교표 (자료=ETRI)

ETRI 엑소브레인 총괄 연구책임자 김현기 박사는 “빅데이터라는 모래밭에서 바늘과 같은 정답을 찾을 수 있는 엑소브레인 심층 질의응답 기술이 개발되어 국내 인공지능이 본격 상용화하는 데 큰 도움이 될 것으로 보인다”고 말했다.

한글과컴퓨터 김만수 미래기술연구본부장도 “엑소브레인이 한글에 탑재됨에 따라 원하는 정보를 편리하고 빠르게 찾을 수 있어 문서작성 생산성과 효율을 높일 수 있게 됐다”고 밝혔다.

엑소브레인 사업단은 지난 2016년 EBS 장학퀴즈에서 우승한 이후 2017년부터 61건의 기술이전 및 사업화로 94억 원의 매출액을 달성했다. 이로써 국내에 구글·IBM 등과 같은 외산 인공지능 솔루션의 시장 잠식을 막는 데 기여하고 있다.

아울러 2017년부터 개발된 언어지능 기술을 오픈 API 및 기계학습 데이터로 보급하여 공개 이후 지금까지 1천 8백만 건 이상 활용됐고 산업체, 대학교, 개인 등 다양한 개발자들이 사용하고 있다. 향후 텍스트뿐 아니라 음성을 통해서도 질의응답을 진행하고 사용자와 더욱 밀접하게 소통할 수 있는 ‘AI 지식 아바타’(가칭) 관련 기술 등을 연구개발 할 예정이다.

한편 ETRI는 엑소브레인 전체 사업을 총괄하며 및 본 기술이 포함된 1세부과제와 전체 세부과제를 이끌고 있다. 2세부과제 주관기관인 솔트룩스는 엑소브레인 지식학습과 지식베이스 구축 기술을 다국어화한 서비스형 AI인 AIaaS(AI as a Service, 클라우드 환경에서 인공지능 인프라, 플랫폼, 소프트웨어 등을 제공하는 서비스형 인공지능) 플랫폼을 개발해 지난 9월, 미국과 일본에 수출하는 성과를 냈다. 3세부과제 주관기관인 KAIST는 워싱턴대학이 주관하는 영어로 시사상식을 묻고 답하는 TriviaQA 챌린지에서 세계 1위를 달성한 바 있다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사