젠슨 황 엔비디아와 CEO(왼쪽)와 오픈AI 공동 창업자 수츠케버가 대담하고 있다. [사진: 엔비디아]
젠슨 황 엔비디아와 CEO(왼쪽)와 오픈AI 공동 창업자 수츠케버가 대담하고 있다. [사진: 엔비디아]

[디지털투데이 황치규 기자]20일(현지시간)일부터 23일까지 엔비디아가 개최한 개발자 컨퍼런스 GTC2023에서 젠슨 황 엔비디아 창업자 겸 CEO와 오픈AI 공동 창업자인 일리야 수츠케버는 AI의현재와 미래를 주제로 대담을 진행해 관심을 끌었다.

이 대담은 오픈AI가 GPT-4를 출시한 다음 날 녹화됐다.

두 사람은 GPT-4와 챗GPT(ChatGPT)를 포함한 그 이전 버전들에 구체적으로 얘기를 나눴다. 

수억 명 사용자 상상력을 사로잡고 있는 심층 신경망의 기능, 한계, 내부 작동 방식에 대해서도 대화를 주고 받았다.

수츠케버는 "챗GPT와 비교했을 때 GPT-4는 여러 측면에서 상당한 개선이 이뤄졌고 새 모델은 텍스트뿐만 아니라 이미지도 읽을 수 있다"면서 "향후 버전에서는 사용자가 응답으로 다이어그램을 돌려받을 수도 있을 것"이라고 말했다.

 젠슨 황은 "챗GPT가 하나의 큰 언어 모델이라는 오해가 있지만, 그 안에는 여러 시스템이 존재한다"고 했고 이에 대해 수츠케버는 오픈AI가 두 단계 학습을 사용한다고 말했다.

첫 번째 단계는 일련의 다음 단어를 예측하는 데 중점을 둔다. 수츠케버는 "신경망이 학습하는 것은 텍스트를 생성한 과정 일부이며, 이는 세상을 투영한 것"이라고 말했다.

이어 "두 번째는 가드레일을 포함해 우리가 원하는 것을 신경망에 전달해 더 신뢰할 수 있고 정확해지도록 하는 것"이라고 덧붙였다.

2012년, 수츠케버는 대규모 데이터셋으로 훈련된 심층 신경망의 위력을 보여준 사람들 중 한 명이다. 학술 경연 대회에서 딥러닝 분야 개척자로 불리는 지오프 힌튼(Geoff Hinton), 알렉스 크리제브스키(Alex Krizhevsky)와 함께 시연했던 알렉스넷(AlexNet) 모델은 인간보다 더 빠르게 이미지를 인식했다.

젠슨 황은 이들이 진행한 연구에 대해 "매우 큰 차이로 기록을 깼고 여기에 불연속성이 있다는 것이 분명했다"며 AI의 빅뱅이라고 평가했다.

AI 혁신들 중 일부는 GPU를 통해 모델에 적용한 병렬 처리에서 비롯됐다는 점도 대담에서 부각됐다.

수츠케버는 "GPU에 매우 적합한 이미지넷 데이터셋과 컨볼루션 신경망 덕분에 전례 없는 속도로 기존에 없던 새로운 것을 훈련시킬 수 있었다”고 말했다.

젠슨 황은 "우리가 서로를 알고 지낸 세월이 10년이다. 그동안 훈련한 모델은 약 100만 배 성장을 이뤘다. 컴퓨터 과학 업계 어느 누구도 그 기간 동안 수행된 계산이 100만 배나 더 커질 것이라고는 믿지 않았을 것이다"라고 말했다.

수츠케버는 "나는 보다 큰 것이 더 좋은 성능을 지닐 것이라는 강한 믿음을 가지고 있었고, 오픈AI(OpenAI)의 목표 역시 확장이었다"고 말했다.

대담 마무리는 AI에 대한 전망에 초점이 맞춰졌다.

GPT-4에 추론 능력이 있느냐는 질문에 수츠케버는 이 용어는 정의하기 어려우며, 아직은 개발 단계일 수 있다고 답했다. 그는 "우리는 계속해서 우리를 놀라게 할 수 있는 시스템을 보게 될 것이다. 최우선 순위는 신뢰성이며, AI가 무엇을 할 수 있는지에 대해 사람들이 믿음을 갖고 AI가 무언가를 모를 때 모른다고 말할 수 있는 지점에 도달해야 한다”고 강조했다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지