[사진: 디지털 사이언스(Digital Science)]
[사진: 디지털 사이언스(Digital Science)]

[디지털투데이 AI리포터] 최근 챗GPT, 스테이블 디퓨전 등 생성 AI 도구가 등장해 누구나 쉽게 문장이나 이미지를 만들어낼 수 있게 된 가운데, IT 뉴스 사이트 디지털 사이언스(Digital Science)의 다니엘 훅 최고경영자(CEO)는 생성 AI가 안고 있는 문제를 바나나 한 개를 통해 설명했다. 

16일(현지시간) 온라인 매체 기가진에 따르면, 평소 바나나를 좋아하는 다니엘 훅 CEO는 이미지 생성 AI 미드저니가 등장했을 당시 이상적인 바나나 이미지를 생성할 절호의 기회라고 생각했다고 한다. 

다니엘 훅은 미드저니에 '회색 배경 위에 그림자를 비추고 있는 바나나 한 개'라는 프롬프트(지시어)를 내렸다. 그렇게 생성된 4개의 이미지에는 실제와 매우 유사한 바나나가 그려져 있었으며, 모두 회색 배경에 그림자를 떨어뜨리고 있다는 점은 확실히 반영됐다. 그러나 바나나는 총 두 개였다. 

한 개의 바나나 이미지만 생성하고 싶었던 다니엘 훅은 프로그래밍에 익숙한 지인에게 이를 상담했고, '바나나를 갖고 있는 원숭이'를 출력한 다음 프롬프트에서 원숭이를 투명하게 하도록 요청하면 가능하지 않을까 하는 제안이 나왔다. 

그 결과, 원숭이는 확실히 생성됐으나 안고 있는 바나나는 또다시 두 개였다. 다니엘 훅이 몇 번이나 시도해봐도 바나나는 반드시 2개 이상 그려졌다는 설명이다. 

다니엘 훅은 생성된 이미지 속 바나나가 2개라는 것은 AI 가진 편견을 드러낸다고 설명했다. 미드저니 프로그램이 바나나의 형태는 배울 수 있어도 바나나의 개수는 배울 수 없다는 것.

다니엘 훅은 "AI의 일반적인 문제 중 하나는 AI 내부에서 무슨 일이 일어나고 있는지 이해하는 것이 거의 불가능하다는 것이다"라며 "AI 기술이 급속히 발전하고 있으나 아직도 현실과는 적잖은 갭이 존재하고 있다"고 지적했다. 

인간의 기술은 상식과 문맥, 물리적인 현실 세계에 의해 보강되고 있으나 AI는 그럴 수 없으며, 인간이 학습용으로 제공한 데이터 세트 이상의 능력을 발휘할 수 없다는 설명이다. 또 인간의 상상력은 나이가 들고 많은 경험을 접할수록 제한되는데, 마찬가지로 AI의 창조성도 상상력의 한계가 있다는 주장이다. 

다니엘 훅은 "챗GPT나 미드저니같은 생성 AI의 출력 결과는 현실을 이해하는 것 같아 보이지만, 물리적 세계의 감각을 갖고 있지 않기 때문에 바나나 1개라는 개념도 이해하지 못하는 것"이라고 전했다. 

이어 "현대의 개발 수준에서 AI는 인간처럼 물체를 인식하지 못한다. AI는 물리적 세계가 아니라 논리적 세계에서 태어나기 때문"이라고 덧붙였다. 

아울러 다니엘 훅이 2주간 1개의 바나나 이미지를 출력하기 위해 계속해서 시도했으나, 여전히 두 개의 바나나가 출력되거나 한 개의 바나나가 두 개로 분리되는 등 문제가 있었다는 설명이다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지