[디지털투데이 유다정 기자] 다시 한번 인간과 인공지능의 바둑 대결이 펼쳐진다. 은퇴를 앞둔 이세돌 9단이 세기의 대결로 불렸던 3년 전 '알파고'와의 대국에 이어 18일부터 토종 바둑 AI '한돌'과 3번 맞붙는다. 과연 이번에는 어떤 승부가 펼쳐질까?

2016년 3월, 이세돌 9단과 알파고의 대국이 열렸다. 당시 '알파고 리'는 48개의 TPU가 사용된 분산 버전이었다. TPU는 구글은 자체 개발한 애플리케이션 집적회로(ASIC)다. 구글은 구체적인 사항은 밝히지 않았지만, 일반 GPU에 비해 최대 10배까지 빠를 수도 있다는 연구가 있을 정도다. 그간 기계가 넘보지 못했던 19X19의 바둑판에서의 무한한 수를 꿰뚫을 수 있었던 이유기도 하다.

알파고는 이후에도 성장을 계속하며, 바둑 규칙만으로 스스로 학습할 수 있는 알파 제로(Alpha Zero)가 됐다. 바둑, 체스, 쇼기 등의 보드게임에 적용되는 범용 인공지능으로, 인간의 기보를 기반으로 지도학습하지 않아도 된다. 이제는 바둑계를 떠나 로봇과 헬스케어 분야 기술 개발까지 나선 상태다.

이세돌 9단이 은퇴 전 마지막 대결 상대로 지목한 '한돌'은 바둑을 위해 만들어진 토종 AI다. NHN이 1999년부터 ‘한게임 바둑’을 통해 쌓아온 방대한 바둑 데이터를 기반으로 개발돼 서비스되고 있다. 개발사인 NHN이 한돌을 개발하기 시작한 계기가 '알파고 쇼크'였던 만큼, 양쪽 모두 의미가 있는 승부다.

 

이세돌9단의 은퇴경기를 함께할 NHN의 바둑AI 한돌(이미지=NHN)
이세돌9단의 은퇴경기를 함께할 NHN의 바둑AI 한돌(이미지=NHN)

 

NHN은 2017년 초부터 10개월 간의 개발 기간을 거쳐 2017년 12월 ‘한돌’ 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치면서 ‘한돌’ 2.0은 1.0에 비해 90%이상의 승률, ‘한돌’ 3.0은 2.0에 비해 90% 이상의 승률을 보이고 있다.

개발 초기 ‘한돌’은 '한게임 바둑' 데이터와 사람이 둔 기보를 학습해서 다음 수를 예측하는 정책망을 사용했다. 출시 시점에는 사람이 둔 기보로 학습한 정책망으로 후보 수를 선택한 후, 자가 대국을 한 기보로 학습한 가치망과, 패턴으로 끝까지 빠르게 둔 롤아웃으로 다음 수에 대한 승리 확률을 얻었다. 이렇게 선택하고 얻은 수에 대한 승리 확률에 MCTS 라는 수읽기 알고리듬을 사용해 다음 수를 예측했다. 

2018년 12월, 출시 1주년을 기념해 진행한 '프로기사 TOP5 vs 한돌 빅매치'에서 한돌은 놀라운 기력을 보여줬다. 한달 간 다섯 명의 최상위 랭킹 바둑 프로기사들과 릴레이 대국을 펼쳐, 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단까지 연이어 승리를 거둔 것이다.

'프로기사 TOP5 vs 한돌 빅매치' 당시 한돌의 버전은 2.1이었다. 당시에도 ‘한돌’은 롤아웃 없이 무작위/자가대국으로 만든 기보로부터 학습한 정책망과 보다 정확해진 가치망만을 통해 다음 수를 예측했다. 여기에 자가 대국을 통해 생성한 기보를 이용해 학습하는 셀프플레이(self play)과정을 반복해 지속적으로 성능을 개선시키는 중이다. 

마지막 대국자였던 신진석 9단은 한돌2.1을 "알파고 마스터 수준과 비슷"하다고 평가하며, "제 세대 프로기사들은 AI를 이기기 어려울 것"이라 말하기도 했다.

이세돌 9단 또한 은퇴 이유로 AI의 등장, 그리고 그에 대한 회의감을 들었다. AI로 인한 무력감, '알파고 쇼크'는 1번의 승리를 거둔 이세돌 9단도 피할 수 없었다. 그가 마지막 대국에서 또 다른 AI인 한돌을 상대로 지목한 것은 이 9단에게도 큰 도전이라는 것이 업계 평가다. 

한돌 3.0은 '알파고 제로'와 '알파 제로' 사이로 추정된다. 기사들의 순위를 매기는 Elo 수치로 따지면 알파고 리가 3500, 한돌 2.1이 4200~4300, 3.0은 4500을 넘는다. 9단은 평균적으로 3500 정도로 평가된다. Elo 차가 400점이 넘을 경우, 승률은 90%로 우세하다고 볼 수 있다.

이번 대국은 이세돌이 흑을 잡아 두 점을 깔고 시작하는 '치수고치기' 방식으로 치러진다. 대국은 18일부터 총 3국에 걸쳐 진행된다. 18일과 19일 오후 12시에 양재 도곡타워 바디프랜드 본사에서 두 차례 대국이 열리며, 마지막 3국은 이세돌 9단의 고향인 전남 신안군에 위치한 엘도라도 리조트에서 21일 오후 12시에 펼쳐질 예정이다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사