[디지털투데이 박근모 기자] 작년 3월 '알파고' 충격 이후 국내외에서 핵심으로 떠오른 단어는 다름아닌 인공지능(AI)이다. 음성비서를 비롯해, 소프트웨어(SW), 빅데이터, 미디어, 자율주행 심지어 보안에 이르기까지 현재 AI가 사용되지 않는 분야는 더이상 존재하지 않는다고 할 수 있을 정도로 빠르게 확산되고 있다. 특히 4차산업혁명이라는 시대의 흐름을 타고 더이상 외면할 수 없는 수준에 다달했다.

국내외 IT 기업들은 AI를 이용해서 기존에 존재했던 기술을 업그레이드하고 또는 새로운 제품을 개발하는 등 AI  기술 주도권을 잡기 위해 치열한 경쟁을 펼치고 있다. 이로인해 AI는 우리의 일상 생활 속에 빠른 속도로 자리 잡아 가고 있다. 특히 통·변역 분야에 있어서 AI의 도입 전·후는 '하늘과 땅 차이'가 날 정도라고 전문가뿐만 아니라 일반 사용자들도 입모아 말하고 있다.

향후 5~10년 이내에 AI 번역 서비스가 사람 번역보다 더 높은 수준에 도달할 것이라는 전망이 나오는 가운데, 이제는 음성인식 기술의 발전으로 실시간 통역에 있어서도 곧 사람 수준을 뛰어넘을 것이라는 조심스런 예측도 나오고 있다. AI에게 그동안 사람만이 가능했던 통번역 영역을 뺏긴다는 걱정스런 말들이 나오는 와중에 혹자는 이제 외국어 공부를 하지 않아도 외국인들과 자유롭게 대화할 수 있길 바란다는 기대 섞인 반응이 교차하는 요즘이다.

번역 분야에 AI 가 접목되면서 큰 발전이 이뤄졌다.(사진=시스트란)

번역의 첫 시작 '기계 번역'

사람이 아닌 기계, 즉 컴퓨터가 사람 대신 내가 모르는 무엇인가를 알 수 있는 것으로 바꿔주는 번역의 시작은 AI와 궤를 함께한다고 해도 과언이 아니다.

1950년대 미국과 소련이 치열한 이념 대립을 했던 '냉전시대'때 미국의 과학자들이 컴퓨터를 이용해 러시아어를 영어로 번역하기 위해 연구를 진행했던 것이 '기계 번역'의 시초라 할 수 있다. 당시 AI에 관한 최고 전문가라고 할 수 있는 앨런 튜링를 비롯해 유수의 과학자들은 러시아어와 영어의 문법을 분석해 규칙화하면 컴퓨터가 분석된 문법 규칙을 기반으로 완벽한 번역이 가능할 것이라고 예상했다. 이 방법이 바로 '규칙기반 기계 번역(RBMT)' 방식이다.

RBMT 기술은 언어학자가 해당 언어의 모든 문법을 전부 규칙화해 컴퓨터 입력 후 번역을 했기 때문에 번역의 정확도가 높았다고 한다. 하지만, 언어학자가 사용된 언어의 문법을 전부 분석해 규칙화시켜 프로그래밍 해야하는 점은 비용과 시간에 있어서 상당히 큰 문제로 꼽혔다. 또한 '구어체'로 작성된 문장의 경우 정해진 문법 규칙 패턴에서 벗어나는 경우가 많아 컴퓨터가 번역에 실패하는 경우도 발생했다고 한다.

초창기 기계 번역은 언어학자라는 사람이 언어를 분석해 규칙을 만들고 패턴을 입력한 값을 컴퓨터가 나열해준다는 점에서 한편에서는 기계 번역이라기 보다 사람이 번역하는 것을 컴퓨터가 보조하는 형태를 뜻하는 CAT(computer assisted translation)라고 말하기도 한다.

그렇다면 우리가 말하는 형태의 번역은 언제부터 시작됐을까? 많은 이들이 구글 번역이 첫 시작이 아니냐고 하지만, 바로 1988년 IBM이 비로소 우리가 그동안 흔히 보던 형태의 번역 기술을 개발해 도입하기 시작했다.

빅데이터를 이용한 '통계기반 기계 번역'

SMT 번역 구조 (자료=포항공대 인텔리전스 SW 랩)

RBMT 기술 방식의 번역의 한계를 인식하고 국가나 글로벌 IT 기업들은 이를 극복하기 위해 다양한 방법을 연구했다. 그 중간에 '예시기반 기계 번역'이라는 방식도 존재하는데 이 방식은 번역을 위한 데이터베이스(DB)에 수십만~수백만에 달하는 번역 예시를 미리 저장해놓고, 번역이 필요한 문장이 입력될 경우 가장 유사한 문장을 번역 결과값으로 출력하는 방식이다. DB에 저장되지 않은 문장의 경우 번역이 아예 불가능하다는 점에서 곧 새로운 번역 방식으로 대체됐다.

우리가 그동안 가장 많이 사용한 번역 방식인 '통계기반 기계 번역(SMT)'는 IBM이 처음 고안한 방법으로, 당시 세계 최대 IT 기업이었던 IBM이 자사가 보유한 빅데이터를 이용해 통계 분석 후 번역 작업을 했던 것에서 시작됐다. 다양한 방법을 통해 수집된 DB를 통해 통계 방식으로 패턴을 찾아낼 수 있어서 RBMT와 달리 사람이 언어의 문법을 규칙화 하는 과정이 불필요해졌다. 그만큼 RBMT에 비해 시간과 비용을 줄일 수 있게 돼 AI가 본격화되기 이전까지 SMT는 번역에 있어서 가장 큰 시장을 차지했다.

SMT는 번역이 필요한 영어로 된 특정 문장이 입력됐을때 이를 한국어로 변환하기 위해서 '문장', '절', '구', '단어'등으로 가장 유사한 패턴의 확률를 찾아내고 이를 다시 언어 특성에 따른 '어순' 조정 과정을 거치게 된다.

전문가들에 따르면 SMT의 경우 보통 번역을 위한 샘플 데이터가 최소 1천만이상의 언어 쌍이 있어야 일정 수준의 번역 품질을 유지할 수 있다. 무엇보다 빅데이터의 절대량이 번역 성능의 바로미터가 된 것이다.

현재 우리가 익히 잘 알고 있고, 많이 사용했던 구글 번역이 검색 포털이라는 특수성을 무기로 수많은 글로벌 사용자들의 검색 데이터를 수집해 글로벌 최대의 언어 데이터를 수집할 수 있었고, 이렇게 수집한 빅데이터를 SMT와 결합해 여타 번역 솔루션보다 한층 뛰어난 번역 품질을 보유하게 됐다.

물론 언어별 DB가 많다고 해서 SMT의 번역 품질이 극적으로 높아지진 않는다. 단적으로 문법 구조가 확연히 다른  한국어와 영어 간의 번역에 있어서는 구조적으로 정확도가 떨어질 수 밖에 없다.

지금까지 단순히 규칙기반, 패턴기반, 통계기반의 번역을 했던 것에서 벗어나 AI가 도입되면서 기계 번역은 일대 변혁이 이뤄졌다. 드디어 이전과는 다른 수준의, 인간과 비교가 가능한 수준으로 기계 번역이 향상됐다.

AI와 결합한 기계 번역, 그리고 딥러닝과 인공신경망 기술

인공신경망 기반 딥러닝 알고리즘 방식의 번역 디자인 (자료=구글)

사실 AI가 도입된 이후에도 SMT 방식은 꾸준히 사용됐다. AI 기술이 발달하면서 빅데이터 속에서 통계 분석하는 방식이 AI로 대체됐고, AI는 이전보다 한차원 빠른 속도와 정확성으로 통계 수준을 높일 수 있었다. SMT의 품질을 높이기 위한 방법 중 가장 효과적인 것이 데이터 양을 늘리는 것이고, AI는 늘어난 데이터를 효과적으로 분석해 SMT의 번역 품질을 기대 이상으로 높일 수 있었다.

하지만, 여전히 사람 번역에 비교하면 큰 차이가 있음은 누구나 알 수 있었다. 많은 전문가들은 이게 바로 기계 번역의 한계라고 했고, 이 한계를 넘기 위해서는 방대한 양의 DB를 끝없이 분석하는 방법밖에 없다고 생각했다.

이같은 흐름은 지난 2006년 제프리 힌튼 토론토 대학교 교수가 인공신경망 기반 딥러닝 알고리즘을 고안하고 그의 제자들이 만든 '딥마인드'를 구글이 인수해 인공신경망 기반 딥러닝 알고리즘이 접목된 AI '알파고'가 공개되면서 번역 분야에 새로운 바람이 일게 됐다.

사람의 뇌와 유사한 구조로 이뤄진 인공신경망 방식 번역을 의미하는 NMT(Neural Machine Translation)는 기본적으로 SMT처럼 AI가 수집된 데이터를 통해 규칙과 통계를 분석하고 최적의 결과값을 도출한다는 점은 유사하다. 하지만 SMT가 '문장', '절', '구' 단위로 쪼개서 통계 분석 후 번역하는 것과는 달리 인공신경망과 딥러닝을 이용해 문장 전체 심지어 문서 전체를 동시에 번역하게 된다. 이는 단어와 단어, 문장과 문장의 의미, 즉 문맥을 분석해서 번역하는 사람 번역과 동일한 방식으로 이뤄지게 된다.

김유석 시스트란 상무는 "인공신경망 기반 딥러닝 알고리즘이 결합 초기에는 사람 번역의 30%에 불과한 수준에서 현재는 70% 정도로 번역 정확도가 높아졌다"라며 "앞으로 언어쌍 데이터를 학습 시킬 수록 번역의 수준이 더욱 놓아질 것"이라고 주장했다.

글로벌 103개 언어 번역이 가능하고, 연간 사용자 5억명, 매일 1000억회 이상의 번역 작업이 이뤄지는 구글의 '구글 번역' 서비스는 지난해 11월 '구글 인공신경망 기계 번역(GNMT)' 기술을 한국어 등 8개 언어쌍 조합에 적용했다.

또한 국내 포털사 네이버도 지난해 10월 NMT 기술이 탑재된 번역 서비스 '파파고' 베타 버전을 공개했고, 평창 올림픽 공식 통역 서비스로 선정된 한컴의 '지니톡'에도 NMT 기술이 탑재되면서 번역 품질이 한단계 높아졌다는 평을 받고 있다.

김유석 상무는 "각기 다른 구조를 지닌 언어 번역에 완벽하게 하기 위해서는 더욱 많은 데이터를 통한 AI 학습이 필요하다"라며 "하지만 금융, 법률, 제조 등 한정된 용어와 단어를 사용하는 특수 영역에 있어서는 AI 번역이 사람 번역과 비슷한 수준까지 성능이 향상됐다"고 설명했다.

이밖에도 다양한 AI 전문가들의 의견으로는 일상 분야에서 아직까지 AI 번역이 사람 번역에 비해 부족한 점이 많은 것은 분명하나, 사용 범위가 한정된 특수 영역에 있어서는 지금 당장 사람 번역을 대체할 수 있는 수준까지 AI 번역 품질이 향상됐다고 의견을 모았다.

번역을 넘어, 실시간 통역은?

한컴이 개발한 번역 SW '지니톡'이 탑재된 AI 통역 로봇 (사진=한컴)

인공신경망 기반 딥러닝 알고리즘이 개발되면서 기계 번역 분야에 큰 전환을 이뤄냈다는 점은 분명한 사실이다. 이에 IT 기업들은 번역을 넘어서 실시간 음성 통역 분야에 연구를 집중하고 있다.

전문가들의 의견에 따르면 문자로 하는 번역이나 음성으로 하는 통역은 기본 구조적으로 큰 차이가 있진 않다고 한다. 문제는 음성을 인식해 텍스트로 변환(STT)하고 이를 다시 음성으로 전달(TTS)하는 기능이 빠른 속도로 이뤄져야 하는데, 발음, 속도, 구어체 사용 등 다양한 이유로 음성을 AI가 제대로 인식하지 못해 오작동을 일으키는 점이 꼽혔다.

AI 음성인식·비서 분야가 활발하게 연구되면서 시끄러운 곳에서도 음성을 제대로 인식하거나 발음, 속도 등에 구애 받지 않고 음성 인식 정확도를 높이는 다양한 방법들이 개발되고 있다.

최근에는 마이크로소프트(MS)가 자사의 인터넷 전화 '스카이프'에 실시간 통역 기능을 넣어 글로벌 각지의 다른 언어를 하는 사람들과 전화 통화를 할때 실시간으로 통역을 해주는 서비스를 공개한 바 있다.

또한 국내의 경우도 네이버, 한컴 등이 각각 '파파고', '지니톡' 등 자사의 번역 애플리케이션에 음성 통역 기능을 추가해 실생활에 적용을 하고 있다.

아직까지는 텍스트 입력 방식의 번역에 비해 통역 분야는 음성의 길이가 길어질수록 인식 오류가 발생할 확률이 높아지는 문제가 발생하고 있지만, 지니톡을 개발 중인 한컴 관계자에 따르면 AI 기술과 함께 음성 인식 기술이 빠르게 발달하고 있어, 곧 기술 고도화가 가능할 것으로 보인다. 특히 한컴은 평창 동계 올림픽이 열리는 내년 2월쯤 지니톡이 탑재된 로봇 통역사를 실제 배치해 외국인 대상으로 통번역 서비스를 제공할 계획도 밝혔다.

AR과 결합하는 이미지 번역까지...고전 등 특수 영역에도 적용 중

지금까지는 텍스트 문자, 음성 등을 번역했다면, 최근에는 동영상 속에 있는 문자, 이미지 속의 문자, 심지어 카메라로 비추면 바로 번역해주는 서비스도 하나 둘 선보이고 있다.

구글이 개발한 AR기반 번역 앱 워드렌즈 (사진=구글)

구글이 지난달 공개한 '워드렌즈' 서비스는 스마트폰 카메라로 간판이나 메뉴판 등을 비추면 설정한 언어로 번역한 결과를 바로 보여준다. 번역 기술과 AR(증강현실) 기술을 결합한 형태로, 스마트폰의 카메라만 있다면 특별한 도구 없이 현실 속의 다른 나라 언어를 실시간으로 번역한 결과로 볼 수 있게 돼 해외 여행시 해당 국가의 언어를 몰라도 여행이 가능할 정도가 됐다.

국내 포털사 네이버도 번역 애플리케이션 파파고에 이미지 번역 기능을 추가해 사진 속 문자를 바로 번역해주는 서비스를 시작했다.

AI 기술이 접목된 통번역 서비스는 여기에서 그치는 게 아니다. 최근 한국고전번역원은 당초 2062년 완역이 예상됐던 조선시대 승정원 일기를 AI 번역 기술을 이용해 2035년 번역을 완료할 계획을 발표한바 있다. 3243권, 2억4300만자에 달하는 승정원 일기 번역 사업은 지난 1994년 시작됐는데, 내용이 길고, 필기체인 한자 초서로 적혀있어 그동안 사람 번역의 한계로 진척이 느렸다. 하지만 NMT를 적용해 이전보다 빠른 번역이 가능해질 전망이다.

이처럼 번역 분야는 AI 기술이 접목되면서 가장 빠르고, 우리의 생활에 밀접한 영향을 주고 있다. 앞으로 AI 기술이 더욱 발전하면서 새로운 외국어를 배우지 않고도, 다른 나라 사람들과 자유롭게 대화를 할 수 있는 날이 빨리 될 수 있길 기대한다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사