[사진: 셔터스톡]
[사진: 셔터스톡]

[디지털투데이 황치규 기자] 챗GPT 같은 생성AI를 둘러싼 테크 기업들 간 레이스가 기술 집약적이면서 또 자본 집약적인 구도 아래 펼쳐지고 있다. 생성AI 훈련과 추론에 들어가는 컴퓨팅 비용이 어마어마 하다 보니 기술이 있어도 돈이 없으면 뛰어들기 힘든 것이 현실이다.

챗GPT 개발사 오픈AI만 봐도 빅테크 기업들 못지 않은 유명세를 구가하고 있지만 수익만 놓고 보면 아직 갈길이 멀다.

디인포메이션에 따르면 오픈AI의 지난해 손실은 전년 대비 두배 가까이 늘어난 5억4000만달러 규모에 달한 것으로 전해진다. 2월 챗GPT 유료 버전을 선보인 후 오픈AI 매출은 빠르게 늘고 있지만 나가는 비용 또한 여전히 만만치 않은 것으로 알려지고 있다. 오픈AI와 오픈AI 전략적 파트너인 마이크로소프트 모두 지금 당장의 수익 보다는 시장 선점 차원에서 일단 돈을 쏟아붓고 있다고 보는 이들도 적지 않다.

생성AI 레이스가 머니 게임 성격이 강한 것은 생성AI에 투입되는 비용이 성능과 비례 관계인 경우가 많기 때문이다. 컴퓨팅 파워를 많이 쓸 수록 생성AI는 보다 나은 성능을 보여줄 때가 많다. 그러다 보니 AI스타트업들이 투자 받은 자금 중 80% 이상을 컴퓨팅 리소스에 지출하고 있다는 분석도 있다.

실리콘밸리 벤처 투자 회사로 다수 AI스타트업들을 포트폴리오로 보유하고 있는 안드레센 호로위츠(a16z)가 최근 웹사이트에 공유한 분석 내용에 따르면  생성AI에 많은 컴퓨팅 비용이 들어가는 것은 알고리즘 자체가 대단히 복잡하기 때문이다. 대규모 데이터베이스 테이블을 정렬하는 알고리즘 복잡성은 GPT-3로 단어 하나를 생성하는 것에 비하면 미미한 수준이라고 한다.

a16z는 "모델들을 훈련시키는 것은 지금까지 인류가 수행한 작업 중 가장 계산 집약적인 작업들 중 하나"라며 막대한 인프라 투자를 필요로 하는 생성AI 비용의 경제학이 단기 간에 근본적으로 바뀌지 않을 것으로 내다봤다.

이를 감안하면 AI에 들어가는 비용을 아낄 수 있는 역량은 AI 업계 판세에 중요한 변수일 수 있다. 소프트웨어와 하드웨어 부문 모두에 걸쳐 AI 비용을 효율화하기 위한 다양한 시도들이 활발한 것도 이와 무관치 않을 것이다.

소프트웨어 측면에서 보면 모델 최적화에 대한 관심이 높다. a16z에 따르면 소프트웨어 최적화는 모델 런타임(runtime: 구동 시간)에 큰 영향을 미칠 수 있다. 10배까지 향상되는 경우도 드물지 않다.

하지만 모델 최적화는 까다로운 작업으로 꼽힌다. 특정 모델과 시스템에 효과적인 방법이 제각각이다 보니, AI 회사들은 모델 최적화를 주특기로 하는 기업들과 협력하는 경우도 만핟. 옥토ML(OctoML)와 세그마인드(SegMind)와 같은 회사들이 특정 생성AI 모델에 대한 최적화 역량을  앞세워 활동폭을 넓혀 나가고 있다고 a16z는 전했다.

인프라를 어떻게 구축하느냐도 AI 비용에 상당한 영향을 미친다. 스타트업들의 경우 클라우드 서비스를 쓰는 경우가 많은데 클라우드마다 가격이 비슷할 것 같지만  현실은 좀 다르다.

a16z에 따르면 엔비디아 A100 칩의 경우 클라우드 서비스들 간 가격이 거의 4배 차이가 나는 경우도 있다고 한다. 코어위브, 람다랩스, 풀루이드스택 같은 AI에 최적화된 클라우드 서비스를 제공하는 회사들이 빅클라우드 대비 가격 경쟁력을 앞세워 시장 공략에 속도를 내고 있는데 따른 결과다.

[테크인사이드] '돈 먹는 하마' AI 인프라...비용 절감 기술 뜬다

비용이 큰 영향을 미치는 흐름이 이어진다면 생성 AI 판세는 결국 기술과 자본을 모두 틀어쥔 빅테크 기업들과 투자를 넉넉하게 받은 스타트업들이 주도할 가능성이 높다. 기술이 있어도 실탄이 없는 AI 기업들은 레이스를 계속하기 어려울 수 있다.

이런 가운데  AI 모델 비용을 둘러싼 진입 장벽을 낮출 수 있도록 지원하는 오픈소스 기반 생성 AI 모델들이 확산되고 있어 주목된다. 메타가 내놓은 라마(LLaMA) 등과 같은 오픈소스 기반 플랫폼을 통해 AI 모델 구축 초기 비용을 크게 줄일 수 있을 것이란 기대감이 고조되고 있다. 

오픈소스 기반 이미지 생성 AI 모델인 스테이블 디퓨전 외에도 최근에는 특히 메타가 연구용에 한해 오픈소스로 공개한 라마(LLaMA)에 대한 AI  개발자들의 관심이 부쩍 높아졌다.

라마의 경우 인터넷에서 확보한 대규모 데이터에서 훈련을 거친 후 공개돼 가중치(weights: AI 학습 과정에서 데이터와 관련된 중요도를 나타내는 매개 변수)가 있는 이들은 상대적으로 적은 비용에 독자적인 LLM을 구현할 수 있다. 이미 라마를 응용한 프로젝트들이 쏟아지는 양상이다. 라마를 포함해 오픈소스 LLM들이 확산되다 보니 오픈AI 역시 독자적으로 오픈소스 LLM 버전을 준비하고 있다는 얘기도 들린다.

오픈소스 AI 모델이 몰고올 부작용을 우려하는 목소리도 적지 않지만 현재로선 AI의 민주화 측면에서 오픈소스 생성AI  모델이 갖는 잠재력을 주목하는 흐름이 강해 보인다.

구글판 '비밀주의' vs 메타식 '개방주의'...생성AI의 미래는?

오픈소스 AI 모델들이 탄력을 받을 경우 AI 모델 레이스에서 비용이 차지하는 비중이 지금보다 낮아지면서 경쟁은 좀 더 평준화될 가능성이 높다. 하지만 오픈소스 AI 모델 영향력이 틈새 시장에 그친다면 생성AI 판세는 소수 기업들이 주도하는 구도로 굳어질 수 있다. 생성AI 생태계판 전체에 큰 영향을 미칠 수 있다는 점에서 AI 비용의 경제학이 어떻게 진화해 나갈지 주목된다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지