오픈AI 추론 모델 o3 [사진: 디지털투데이]
오픈AI 추론 모델 o3 [사진: 디지털투데이]

[디지털투데이 홍진주 기자] 오픈AI가 최근 발표한 차세대 인공지능(AI) 모델 'o3'는 인간을 압도할 만큼 강력한 성능을 보여주지만, 동시에 누구나 쉽게 풀 수 있는 퀴즈에서 실수를 저지르기도 한다. 이러한 불균형한 AI 성능을 설명하는 '들쭉날쭉한 인공일반지능'(Jagged AGI) 개념이 주목받고 있다.

22일(현지시간) 온라인 매체 기가진에 따르면 미국 펜실베이니아대학교 워튼스쿨 경영학자인 에단 모릭(Ethan Morick) 교수는 최근 조지메이슨대학교 경제학 교수인 타일러 코웬이 "o3가 AGI라고 생각한다"라고 말한 것을 계기로 o3와 AGI에 관한 논의에 다시 주목하게 됐다고 한다. AGI는 인간과 유사한 지능과 스스로 학습할 수 있는 능력을 갖춘 소프트웨어를 만들려는 이론적 AI 연구 분야다. 

모릭은 실제로 o3가 얼마나 발전하고 있는지를 확인하기 위해 해당 모델에게 "새로운 치즈 가게를 시작할 테니 기발한 캐치프레이즈를 20개 정도 생각해 달라"고 요청했으며, 그 결과 o3는 2분도 안 돼서 캐치프레이즈를 생각해 냈을 뿐만 아니라, 각 옵션의 순위를 매기고, 웹 조사를 하고, 로고를 고안하고, 마케팅 계획과 재무 계획을 세우고, 웹 사이트 모형까지 만들어냈다고 한다.

모릭은 "내 지시가 다소 막연했고, 상식적인 판단이 요구되는 상황이었음에도 불구하고 AI는 이를 전혀 문제 삼지 않고 자연스럽게 처리해 냈다"라며 놀라움을 드러냈다.

하지만 모릭에 따르면 o3는 인간 전문가에 버금가는 업무를 단시간에 처리할 수 있는 반면, 어이없는 대답을 내놓는 등 놀랍도록 초보적인 실수를 저지르기도 한다. 이는 AI가 인터넷에서 학습한 잘못된 패턴을 그대로 적용했기 때문인 것으로 보이며, 이 같은 실수는 o4-미니(o4-mini)에서도 확인할 수 있었다. 이에 대해 모릭은 AI 성능이 특정 영역에서는 뛰어나지만, 다른 영역에서는 여전히 한계를 보인다고 지적했다.
 

인공일반지능(AGI) [사진: 셔터스톡]
인공일반지능(AGI) [사진: 셔터스톡]

모릭은 AI 모델의 능력이 고르지 못한 것을 표현하기 위해 지난 2023년 들쭉날쭉한 프론티어(Jagged Frontier)라는 개념을 제시하기도 했다. 그로부터 1년 여가 지난 지금, AGI라고 불릴 정도로 비약적인 발전을 이룬 모델조차 이런 초보적인 실수를 저지르는 것에 대해 "프론티어가 얼마나 들쭉날쭉한지 보여주는 것"이라고 모릭은 말한다.

또한 모릭은 AI가 인간적 지능을 갖췄는지 평가하는 기존의 지표나 벤치마크들이 AI 발전 속도를 따라가지 못하고 있다고 지적했다. 특히, AI가 '튜링 테스트'(Turing Test)를 통과했다는 연구가 발표되었지만, 이 결과가 무엇을 의미하는지는 여전히 모호하다는 것이다. AGI 개념 역시 오래전부터 존재했지만, 지금도 어떤 기준을 충족해야 AGI라 부를 수 있는지에 대한 합의가 없다는 점도 고려해야 한다.

이어 그는 "AI가 AGI에 도달했더라도 사회적 변화는 즉각적으로 나타나지 않을 것"이라며, "이 기술이 실질적인 영향을 미치기까지는 시간이 필요하다"라고 지적했다. 그러면서 "이 들쭉날쭉한 성능 문제를 잘 헤쳐나가는 사람만이 향후 시장에서 가장 좋은 지위에 설 수 있을 것"이라고 말했다.

한편, 오픈AI의 o3은 AI 벤치마크들 중에서도 가장 난이도가 높은 테스트에서 연달아 최고 성적을 기록하며 유례없는 성과를 거둔 것으로 알려져, 업계에서는 해당 모델이 AGI로 가는 단초가 될 수 있을지에 대한 논의가 활발히 이어지고 있다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사