[사진: 오픈AI]
[사진: 오픈AI]

[디지털투데이 황치규 기자] 구글 람다(Language Model for Dialogue Applications:  LaMDA)에 이어 오픈AI가 개발한 대화형 AI 챗봇인 '챗GPT'(ChatGPT) 테크판 흥행 키워드로 급부상했다.

람다의 경우 테스트를 하던 구글 엔지니어가 람다에 지각이 있다는 주장을 펼치면서 화제가 됐는데, 최근 공개된 챗GPT는 멀티 플레이어로서의 역량이 비상한 관심을 끄는 모습이다.

오픈AI 설명을 보면 챗GPT는 사람과 대화하는 방식으로 질문에 답하고 지시를 따른다. 사용자는 코딩도 하고, 소셜 미디어에 포스트도 올리고 텔리비전 쇼를 위한 원고 쓰는 일도 챗GPT에 시킬 수 있다.

관심을 반영하 듯 챗GPT는 초기 데모 버전이 공개된 지 5일 만에 이미 100만명이 넘는 사용자들이 몰렸다.  

챗GPT는 온라인에 있는 정보 기반으로 훈련된 거대 언어 모델이다. 챗GPT에 가입하면 사용자는 다양한 분야들에 대해 질문할 수 있다. 1955년에 미국 대통령은 누구였는지와 같은 단답형 질문부터 어려운 개념을 쉽게 이해할 수 있도록 요약해 달라고도 요청할 수 있다. CNN 보도를 보면 삶이란 무엇인가, 오늘 바깥 온도가 40도면 무엇을 입어야 하는지 등 정답이 없는 질문도 할 수 있다. 이미지 생성 AI에 지시할 명령을 작성하거나 리포트를 쓰는 데도 챗GPT를 활용할 수 있다.

챗GPT는 단순 질문에 답하는 것은 넘어 실수도 인정할 뿐만 아니라 질문에 잘못된 전제가 있다면 거기에 대해 이의를 제기하고 부적절한 요청은 거부하는 역량도 갖췄다.

그러다 보니 개발자들 사이에선 인간을 닮은 범용 AI까지는 아니더라도 꽤 수준 높은 AI가 등장했다는 평가가 나오고 있다. 챗GPT가 구글 검색 킬러가 될 수 있다는 시선도 엿보인다. 구글 광고 팀 수석 부사장 출신으로 검색 스타트업 니바(Neeva)를 공동 창업한 스리드하르 라마스와미(Sridhar Ramaswamy)는 "AI는 우리가 알고 있는 검색을 바꿀 잠재력이 있다"면서 생성 AI가 검색 판세에도 변수가 될 수 있음을 예고한 바 있다.

기술적으로 설명하면 챗GPT는 사용자가 텍스트를 치면 다음에 어떤 단어가 올치 예측하는 AI인 GTP-3.5 새 버전으로 사용자 지시에 구체적으로 대응하는 인스트럭트GPT(InstructGPT)와는 형제격으로 볼 수 있다. 

사용자 피드백을 받는 가운데 강화학습(Reinforcement Learning) AI 기술로 훈련을 받았다. 지도 학습 기반 미세 조정(supervised fine-tuning)을 사용해 초기 모델을 훈련시켰다는 것이 오픈AI 설명이다.

훈련 과정은 대충 다음과 같다. 인간 교육자는 사용자와 AI 모두에 대화 데이터를 공급하고 챗GPT가 보이는 대응을 평가하고 랭킹을 매긴다. 이들 평가를 챗봇에 다시 제공해 어떻게 대응해야 하는지 배울 수 있게 한다. 지금은 챗GPT 기술을 개선하기 위해 사용자 피드백에 의존하고 있다는게 오픈AI 설명이다.

구체적으로 챗GPT를 어디에 어떻게 활용할 수 있을까? 트위터에 공유되는 내용들을 보면 챗GPT는 정말로 다양한 분야에 다양한 용도로 쓰인다.

챗GPT를 활용핸 코드에서 문제를 찾아내는 화면. [사진: 오픈AI]
챗GPT를 활용핸 코드에서 문제를 찾아내는 화면. [사진: 오픈AI]

소프트웨어 개발과 관련해서는 챗GPT로 코드에 있는 버그를 설명하고, 수정하는 것이 가능하다. 버그를 찾아 없애는 디버깅(debugging) 도구로서 잠재력이 크다는 얘기도 들린다. 버그를 찾는 것은 넘어 챗GPT는 개발자들에게 아예 코드를 어떻게 짜는지까지 알려준다.

대학생들이 에세이를 작성하는데도 챗GPT는 투입될 수 있다. 비즈니스 인사이더는 두개 다른 민족주의 이론들을 비교하고 대조하는 에세이를 챗GPT로 쓴 것을 예로 들어 눈길을 끌었다. 비즈니스 인사이더는 또 챗GPT로 해리포터를 주제로한 텍스트 비디오 게임을 만든 사례도 공유했다.

챗GPT는 영어 뿐만 아니라 한글로도 이용할 수 있다. 하지만 써본 이들 평가를 보면 한글보다는 영어로 쓸 때 결과물이 훨씬 뛰어나다고 한다.

챗GPT는 공식 서비스가 아니라 아직은 실험적인 데모 버전 성격이다 보니 정보 정확성과 편향 문제에서 자유롭지 않은 것이 현실이다. 결과물에서 최신 정보가 누락될 수 있다는 것도 문제들 중 하나로 꼽힌다.

이런 가운데 개발자 정보 공유 사이트인 스택오버플로우는 사용자들을 상대로 챗GPT가 생성한 정보를 공유하는 것을 잠정적으로 금지했다. 정보가 부정확할 가능성이 크다는 이유에서였다.

거대한 규모를 고려하면 챗GPT가 생산하는 대답들 중 정확하지 않은 것들 비중이 어느 정도인지는 구체적으로 파악하기 어렵다. 하지만 스택오버플로우의 챗GPT가 사용자들을 오도할 리스크가 매우 높다고 판단했다고 더버지는 전했다.

챗GPT에 대해 스택오버플로우가 내린 결정을 놓고 공방도 벌어지는 모습이다. 개발자들 사이에선 스택오버플로우 콘텐츠 관리자들이 관련 정보가 챗GPT가 만든 것인지 아닌지 먼저 구분하기 어려울 것이라는 얘기도 나오고 있다.

 

키워드

#AI #오픈AI #챗GPT
저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지