생성AI의 확산으로 GPU 수요가 높아지고 있다 [사진: 셔터스톡]
생성AI의 확산으로 GPU 수요가 높아지고 있다 [사진: 셔터스톡]

[디지털투데이 황치규 기자]거대 언어 모델(LLM) 기반 생성AI 모델을 둘러싼 업체들 간 경쟁도 뜨겁지만 생성AI를 돌리는데 필요한 AI 칩을 겨냥한 '싸움의 열기' 또한 만만치 않다. GPU로 AI 칩 시장에서 80% 이상 점유율을 틀어쥔 엔비디아를 향한 경쟁사들의 도전이 거세지고 있는 가운데, 지배력을 강화하기 위해 엔비디아도 적극적으로 맞불을 놓고 있다.

엔비디아는 8일(현지시간) AI 모델을 보다 효과적으로 운영할 수 있도록 지원하는 GH200 칩을 발표했다.

회사 측에 따르면 GH200칩은 현재 엔비디아가 제공하는 최고 성능 GPU인 H100과 같은 GPU에 기반하지만 보다 큰 메모리 용량을 지원해 인프라를 보다 저렴하게 운영할 수 있다.

GH200과 관련해 젠슨 황 엔비디아 CEO는 "원하는 거의 모든 거대 언어 모델을 올려 놓고 열심 추론할 수 있다. 거대 언어 모델 추론 비용이 크게 줄어들 것이다"고 목소리를 높였다.

GH200은 141기가바이트(GB) 메모리와 72코어 ARM CPU를 지원해 AI 모델은 효과적으로 운영할 수 있도록 지원한다. 

내년 2분기 엔비디아 총판들을 통해 이용할 수 있고 샘플은 올해안에 활용이 가능하다.

AI 모델 운영은 크게 훈련과 추론으로 나눠지는데 GH200은 추론을 지원하는데 초점이 맞춰져 다. 보다 많은 메모리 용량을 지원해 단일 시스템으로 거대 AI 모델을 상대적으로 많이 커버할 수 있다. 모델을 돌리기 위해 여러 시스템들이나 GPU를 투입하지 않고 하나의 CPU로 모델을 운영할 수 있는 가능성이 커진다는 설명이다.

GH200과 달리 엔비디아 H100은 현재 80GB 메모리를 지원한다. 엔비디아에 앞서 AMD는 최근 192GB 메모리를 지원하는 AI 칩 MI300X를 발표했다. AMD 역시 MI300X와 관련해 AI 추론을 위한 역량을 강조하고 있다.

월스트리트저널(WSJ) 최근 보도에 따르면 AMD의 포레스트 노로드 데이터센터 하드웨어 부문 총괄은 "산업은 엔비디아 경쟁자를 원하고 있다. 많은 이들이 간절하게 대안을 원하고 있다"고 말했다.

노스랜드 캐피털 마켓 구스 리차드 애널리스트 최근 추정에 따르면 AI 칩 시장에서 AMD 점유율은 시간이 가면서 20%에 이를 것으로 전망됐다. AMD은 제품에 강점이 있고 시장은 엔디이아에 이서 두번재 공급을 필요로 한다는 이유에서였다.

CPU 시장을 틀어쥔 인텔도 자사 GPU와 관련해 "폐쇄적인 생태계에서 벗어나고자 하는 고객들에게  매력적인 옵션"이 될 수 있다"면서 최근 벤처마크 결과를 부각하고 있다.

AMD와 인텔 모두 AI 역량 강화를 위해 최근 몇년 간 인수합병도 적극 추진했다. 2022년 AMD는 350억달러 규모에 자일링스를 인수했다. 자일링스는 생산된 후 다시 디자인할 수 있고 AI 계산에 적합한 칩 디자인이 주특기다. 인텔은 2019년 이스라엘 AI 스타트업인 하바나랩스를 20억달러 규모에 인수했고 자체 AI 칩을 생산하고 있다.

경쟁 업체들은 소프트웨어 측면에서도 엔비디아와 차별화에 주력하고 있다. 엔비디아 소프트웨어는 독점적이어서 소프트웨어 개발자들은 이를 자유롭게 다룰 수 없는 반면 인텔과 AMD는 일부 고객들은 매력적으로 생각할 수 있는 오픈소스 대안을 제공하고 있다고 WSJ은 전했다.

아마존웹서비스(AWS)와 구글클라우드 등 빅클라우드 업체들도 자체 AI 칩 개발 레이스에서 중량감 세력으로 부상했다. AWS는 자체 개발한 칩을 엔비디아에 저렴한 대안으로 적극 제안하고 있고 바이트댄스, 에어비앤비, 스냅 등을 고객사로 확보했다. 틱톡을 운영하는 중국 인터넷 업체인 바이트댄스는 아마존 칩을 사용해 AI 모델 배치 이용을 최대 60%까지 줄였다고 WSJ이 AWS 임원을 인용해 전했다.

키워드

#엔비디아 #GPU
저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지