[사진: 셔터스톡]
[사진: 셔터스톡]

[디지털투데이 황치규 기자] 인공지능(AI)과 고성능 컴퓨팅(HPC)에 필요한 IT인프라를 놓고 퍼블릭 클라우드 서비스 및 기존 서버 회사들의 행보에 가속도가 붙었다. 관련 업계는 앞다퉈 AI와 HPC 워크로드 지원에 최적화된 서버들을 쏟아내고 있다.

특히 기존 서버 회사들의 행보가 두드러진다. 

IT인프라 패러다임에서 퍼블릭 클라우드 서비스가 갖는 중량감이 점점 커지고 있지만 AI와 HPC 워크로드의 경우 온프레미스(구축형) 인프라로 해볼만 하다는 것이 관련 업계의 입장이다. 머신러닝이나 딥러닝 AI 모델의 경우 비용 문제로 퍼블릭 클라우드 대신 온프레미스 인프라를 활용하는 사례가 적지 않다는 설명이다.

한국 델 테크놀로지스는 11월 HPC와 최적화된 GPU 집약적인 파워엣지 서버 신제품 및 서비스, 4세대 AMD 프로세서 기반 서버 신제품을 발표했다.

회사 측에 따르면 파워엣지 XE9680 (PowerEdge XE9680)은 GPU 8개를 탑재한 모델로, 8개 엔비디아 H100 텐서 코어 또는 엔비디아 A100 텐서 코어를 활용해 고성능을 제공한다.  향후 출시될 4세대 인텔 제온 스케일러블(Xeon Scalable) 프로세서 2개와 8개 엔비디아 GPU를 결합하여 AI 워크로드에 최대 성능을 제공할 것이라고 한국 델은 설명했다.

김경진 한국 델 테크놀로지스 총괄사장은 “성능 타협 없이 지속 가능성을 추구해야 하는 고객들 요구에 부응하기 위해 델은 효율적인 워크로드 처리와 복원력 제공에 집중하고 있다”면서 “더 빠른 혁신을 위한 시장 경쟁이 심화되고 있는 만큼 이전 세대 대비 월등한 성능 향상과 전력 및 냉각 기술을 강화했다. 이번에 새롭게 공개한 신규 솔루션들이 델 HPC와 AI 분야 리더십을 강화해줄 것이라 믿는다”고 말했다.

HPE도 11월 AI, 분석, 클라우드 네이티브 애플리케이션, 그래픽 애플리케이션, 머신러닝, 가상데스크톱환경(VDI)에 적합한 '프로라이언트 Gen11' 서버 시리즈를 내놨다.

이전 세대보다 주요 애플리케이션에 대해 두 배 입출력 대역폭을 지원하고 33% 높은 GPU 집적도로 AI 워크로드를 처리할 수 있다는게 회사측 설명이다. 닐 맥도날드(Neil MacDonald) HPE 부사장 겸 컴퓨트(compute) 부문 총괄 매니저는 "이번에 발표한 HPE 프로라이언트 서버는 하이브리드 생태계에 맞게 직관적인 클라우드 운영 경험, 설계부터 반영된 보안, 워크로드에 최적화된 성능을 제공한다"고 강조했다.

레노버도 최근 HPC, AI 워크로드를 효과적으로 처리하는 씽크시스템 V3 서버 신제품을 발표했다.

AI와 HPC를 겨냥한 퍼블릭 클라우드 회사들 행보도 최근 들어 빨라지고 있다. 마이크로소프트는 최근 AI 슈퍼 컴퓨터 구축을 위해 엔비디아와 다년 간에 걸친 협력을 발표했다. 양사 협력은 AI를 훈련시키고 확장하는데 필요한 거대한 컴퓨팅 워크로드를 다루는데 초점이 맞춰져 있다.

양사가 구현할 AI 슈퍼컴퓨터는 마이크로소프트 애저 클라우드 인프라에 기반하며 수만개에 달하는 엔비디아 H100, A100 데이터센터 GPU 및 퀀텀-2(Quantum-2) 인피니밴드 네트워크 플랫폼을 사용한다.

양사는 마이크로소프트 딥러닝 최적화 소프트웨어인 딥스피드(DeepSpeed)도 공동 개발하기로 했다.

엔비디아에 따르면 양사가 개발한 슈퍼컴퓨터는 자기 학습(self-learning) 알고리즘을 사용하는 스테이블 디퓨전 및 달리 같은 거대 언어 모델 기반 생성 AI 연구 및 발전에 활용될 수 있다. 

텍스트, 코드, 디지털 이미지, 영상, 및 오디오 같은 콘텐츠를 생성하는 이들 AI 모델은 최근 몇년간 빠르게 성장했고 이를 지원하는 강력한 컴퓨팅 인프라에 대한 수요도 증가하고 있다. 엔비디아와 마이크로소프트 간 협력도 이같은 수요를 잡기 위한 행보다.

세계 최대 퍼블릭 클라우드 서비스 아마존웹서비스(AWS)도 자체 개발한 ARM 기반 칩 그래비톤을 앞세워 HPC 시장 공략을 본격화했다. AWS는 최근 미국 라스베이거스에서 개최한 연례 테크 컨퍼런스 리인벤트2022에서 HPC 워크로드를 겨냥한 ARM 기반 그래비톤 칩 새 버전인 그래비톤3E를 발표했다.

그래비톤3E 발표는 AWS가 자체 칩으로 인텔, AMD, 엔비디아와 HPC 시장에서도 경쟁하게 됐다는 것을 의미하는 것이어서 주목된다. 그래비톤3E는 벡터 명령(vector instructions)에 크게 의존하는 워크로드에서 기존 그래비톤  칩 대비 35% 빠른 것을 포함해 상당한 성능 향상을 제공한다는 것이 AWS 설명이다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지