구글 vs. 오픈AI [사진: 셔터스톡]
구글 vs. 오픈AI [사진: 셔터스톡]

[디지털투데이 황치규 기자] 생성AI 열풍의 주역인 챗GPT 개발사 오픈AI를 견제하기 위한 거물급 회사들의 맞불작전이 본격화됐다. 챗GPT와 챗GPT 기반 기술인 거대언어모델(LLM) GPT-4와 자웅을 겨룰 경쟁 제품들이 실전에 속속 투입되고 있다. 

현재 빅테크 기업들 중에선 구글, 오픈AI처럼 AI 스타트업들 중에선 앤트로픽의 행보가 두드러진다. 오픈AI와 전략적 파트너인 마이크로소프트가 주도해 온 생성AI 판세에 의미 있는 변화로 이어질 수 있을지 관심이 쏠린다.

지금 상황에서 오픈AI를 위협할 수 있는 가장 유력한 후보는 구글이다. 구글은 최근 연례 개발자 컨퍼런스 I/O에서 오픈API GPT-4와 맞불을 LLM인 PaLM(Pathways Language Model)2를 공개했고 챗GPT 대항마로 제한적으로 제공하던 AI 챗봇 서비스인 바드(Bard)도 전면 오픈했다. 한국어와 일본어에 대한 지원도 추가했다. 구글은 바드에서 쓸 수 있는 이미지 생성 AI에 대해 어도비와도 손을 잡았다.

생성AI 가능성을 현실화하는데 결정적인 영향을 한 것으로 평가되는 트랜스포머 AI 기술을 개발한 당사자인데다 자금과 인재 측면에서도 오픈AI에 밀릴 것이 없는 만큼, 구글이 PaLM2와 바드로 오픈AI를 어느 정도 압박할 수 있을지는 테크판에서 이미 초미의 관심사가 됐다.

구글에 따르면 PaLM2는 100개 이상 언어를 지원하고, 추론, 코드 생성, 여러 언어 번역을 할 수 있다.

PaLM2는 게코(Gecko), 오터(Otter), 비슨(Bison), 유니콘(Unicorn) 4개 크기로 제공된다. 게코는 규모가 가장 작고, 모바일 기기에서도 돌아갈 수 있는 것으로 알려졌다. PalM2는 바드 외에도 구글 독스, 구글 시트, 구글 슬라이드 같은 다양한 구글 서비스들에도 기반 LLM으로 투입된다.

기술 보고서를 보면 PaLM2은 일부 수학적인 계산, 번역, 추론 작업 GPT-4를 앞서는 것으로 보인다.

그러나 보고서에 있는 벤치마크 결과는 실전에서 통하지 않을 수도 있다. AI에 대해 자주 글을 에단 몰릭(Ethan Mollick) 와튼스쿨 교수 바드에 적용된 PaLM2에 대한 대략적인 테스트를 진행한 결과 다양한 일상언어에서 GPT-4와 빙 검색 성능에는 미치지 못한다는 의견을 보였다. 국내 한 AI 전문가도 "PaLM2 기술 보고서를 봤는데, GPT-4에 근접했다면서도 낫다고 보기는 어렵다"고 말했다.

구글은 2022년 4월 PaLM 첫 버전을 공개했다. 하지만 최근까지 PaLM은 외부에선 접근할 수 없는 구글 내부용 제품으로 제공됐다. 이런 가운데 구글은 3월부터 외부 개발자들이 상대로 PaLM API에 접근할 수 있도록 기술을 개방했고 이번에 PaLM2를 선보이면서 생태계 확장에 속도를 낼 것으로 보인다.

지난해 공개된 첫 PaLM은  5400억개 파라미터(매개변수)라는 거대한 규모로 큰 관심을 끌었다. 파라미터는 모델이 학습한 '지식' 규모로 통상 파라미터가 많으면 생성AI 역량은 강화되는 것으로 알려져 있다. 2020년 나온 오픈AI GPT-3 파라미터는 1750억개 수준이다.

하지만 아쉽게도 GPT-4와 PaLM2는 파라미터 기준으로 일대일 비교가 어렵다. 오픈AI와 구글 모두 파라미터 숫자를 공개하지 않은 탓이다.  두 회사가 AI 기술에 대해 점점 폐쇄적으로 바뀌는 것에 대해 AI 전문가들 사이에선 우려도 적지 않다. 아스테크니카에 따르면 구글은 PaLM2와 관련해  웹 문서, 책, 코드, 수학, 대화형 데이터 등 다양한 데이터 소스들에서 훈련됐다고 밝혔지만 구체적으로 어떤 데이터를 활용했는지에 대해서는 공개하지 않았다.

LLM을 향한 구글의 공세는 PaLM2를 넘어서도 계속될 듯하다.  I/O 컨퍼퍼런스에서 순다 피차이 구글 CEO는 새로운 멀티모달(multimodal) AI 모델인 제미나이(Gemini)에 대한 훈련도 진행하고 있다고 밝혔다.

오픈AI 출신 연구원들이 설립한 AI 스타트업 앤드로픽 행보도 눈길을 끈다. 앤트로픽은 최근 자체 개발한 AI 챗봇 클로드(Claude) 컨텍스트 윈도(context window)를 7만5000단어까지 확장했다.

컨텍스트 윈도는 LLM 시스템들이 돌아가는 동안 처리할 수 있는 입력과 출력 텍스트 양을 의미하며 컨텍스트 윈도가 커졌다는 것은 사용자가 AI챗봇과 한번에 보다 긴 대화를 할 수 있다는 것으로 보면 된다. 챗GPT 컨텍스트 윈도는 대략 3000단어다. 컨텍스트 창이 꽉 차면 AI 챗봇은 대화 내용을 까먹기 때문에 오류로 이어질 수 있다. 마이크로소프트 빙에 적용된 AI 챗봇이 20회로 대화를 제한한 것도 이 때문이다.

앤트로픽에 따르면 7만5000단어 규모 컨텍스트 윈도는 소설 위대한 개츠비 길이 텍스트를 1분도 안돼 읽을 수 있는 수준이다. 앤트로픽은 위대한 개츠비에서 한문장을 편집하고 어디가 바뀌었는지 찾아달라고 했는데, 클로드는 22초 만에 이를 알려줬다고 한다.

사람이 7만5000단어로 된 텍스트를 읽는 데는 약 5시간이 걸리지만, 클로드는 이를 읽고 요약하고 분석하는 작업을 몇분 안에 처리할 수 있다는게 앤트로픽 설명이다. 현재 확장된 클로드 컨텍스트 윈도는  API를 통해 클로드를 활용하는 앤트로픽 비즈니스 파트너들만 이용할 수 있다.

지난해 말을 기점으로 오픈AI를 향한 도전자들은 점점 늘고 있지만 아직까지 오픈AI가 갖는 존재감이 줄고 있다는 시그널은 보이지 않는다. 오픈AI와 마이크로소프트 동맹은 적어도 아직까지는 생성AI 레이스를 주도하는 분위기다. 수시로 중량급 뉴스들을 쏟아내고 있다.

이런 가운데 구글과 앤드로픽 같은 회사들은 말이 아니라 행동으로 맞대응에 나서면서 생성AI 판세는 점점 흥미롭게 바뀌는 양상이다. 구글과 앤트로픽과 같은 회사들 공세가 먹혀들 경우 범용 LLM 시장은 다자간 경쟁 구도로 재편되겠지만 그렇지 않을 경우 오픈AI가 갖는 지위를 흔들가 어렵다는 인식이 더욱 확산될 수 있다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지