![AI 데이터센터를 둘러싼 빅테크 기업들 간 경쟁이 고조되고 있다 [사진: Reve AI]](https://cdn.digitaltoday.co.kr/news/photo/202510/598282_555749_2610.jpg)
[디지털투데이 황치규 기자] AI를 지원할 초거대 AI 데이터센터를 둘러싼 빅테크 기업들 간 경쟁이 점점 고조되는 가운데, 수많은 AI 칩들을 빠르게 활용할 수 있는 네트워크 기술 고도화에 대한 업계 움직임이 활발하다.
퍼블릭 클라우드 및 대형 인터넷 플랫폼 등 대규모 데이터센터에 기반하는, 이른바 하이퍼스케일러 기업들이 AI 워크로드에 최적화된 네트워킹 아키텍처를 주목하면서 이 기술을 둘러싼 판세가 급변하는 모양새다.
AI 칩의 대명사인 엔비디아도 스펙트럼-X를 앞세워 초거대 AI데이터센터를 겨냥한 네트워크 생태계 구축에 공격적이다. 엔비디아는 데이터센터에서 AI를 지원하는 핵심 구성요소들을 한꺼번에 제공하는 AI팩토리(AI factories) 전략 일환으로 네트워크 역량에 대한 투자를 확대해왔다.
엔비디아는 6년 전 멜라녹스를 인수를 통해 초고속 네트워킹 프로토콜인 인피니밴드(InfiniBand)기술을 확보했고 스펙트럼-X를 통해 전통적인 데이터센터들에서 광범위하게 사용되는 네트워크 기술인 이더넷 스위치로도 영토를 확장하고 있다.
엔비디아에 따르면 최근 메타와 오라클이 AI 데이터센터 성능 확장 일환으로 스펙트럼-X 이더넷 네트워킹 스위치를 투입하기로 했다. 메타와 오라클은 수백만게 GPU를 연결해 1조 매개변수 모델을 지원하는 차세대 AI 인프라에 엔비디아 스펙트럼-X를 지원한다.
젠슨 황 엔비디아 CEO는 “스펙트럼-X는 단순히 더 빠른 이더넷이 아니다. 이는 AI 팩토리 신경계 역할을 하며, 하이퍼스케일러들이 수백만 개 GPU를 하나의 거대 컴퓨터로 연결해 사상 최대 규모의 모델을 훈련할 수 있도록 지원한다"고 말했다.
오라클은 스펙트럼-X 이더넷 스위치를 자사 오라클 클라우드 인프라(OCI)에 통합해 엔비디아 베라 루빈( Vera Rubin) 아키텍처 기반 신형 AI 슈퍼컴퓨터 일부를 구성할 예정이다. 오라클은 이번 협력을 통해 생성형 및 추론 AI 수요 증가에 대응할 수 있는 오라클 클라우드 역량을 확장한다는 전략이다.
메타는 대규모 데이터센터 전반에 걸쳐 네트워크 스위치를 관리하기 위한 자사 전용 소프트웨어 플랫폼인 페이스북 오픈 스위칭 시스템(FBOSS) 내에 스펙트럼 이더넷 스위치를 배포할 예정이다.
메타 네트워킹 엔지니어링 부사장 가야 나가라잔은 “메타 차세대 AI 인프라에는 업계가 지금까지 경험하지 못한 규모로 개방적이고 효율적인 네트워킹이 필요하다"면서 “엔비디아 스펙트럼이더넷을 미니팩3N(Minipack3N) 스위치와 FBOSS에 통합함으로써, 우리는 오픈 네트워킹 접근 방식을 확장하는 동시에 점점 더 커지는 모델을 학습시키고 생성형 AI 애플리케이션을 수십억명에게 제공하기 위해 필요한 효율성과 예측 가능성을 확보할 수 있다"고 말했다.
AI 칩 시장에서 엔비디아 대항마드를 측면에서 지원하고 있는 브로드컴도 네트워크를 겨냥한 행보에 속도를 내고 있다. 로이터통신에 따르면 브로드컴은 차세대 AI 전용 네트워크 칩 토르 울트라(Thor Ultra)를 출시할 예정이다. 이 칩은 거대 AI 모델을 구동하는 데이터센터에서 수십만 개 AI 칩들을 효율적으로 연결할 수 있도록 설계됐다.
브로드컴은 이 칩을 통해 생성형 AI 수요에 따른 초고속 데이터 처리 수요에 대응하고, 기존 엔비디아 중심 AI 네트워킹 시장에서 입지를 확대한다는 계획이다. 업계에서는 브로드컴이 네트워크 칩과 AI 가속기 설계·제조를 모두 지원함으로써, 엔비디아가 독점해온 AI 인프라 시장에서 대안으로 부상할 가능성을 주목하고 있다고 로이터통신은 전했다. 브로드컴은 토르 울트라를 시작으로 AI 인프라 전반을 아우르는 통합 네트워크 솔루션으로 포트폴리오를 확대할 계획이다.
오라클도 최근 OCI 네트워크 소프트웨어 및 아키텍처 제품군인 오라클 액셀러론(Oracle Acceleron)를 업데이트했다. 고속 GPU 간 연결을 지원하는 오라클 액셀러론 아키텍처는 수백만 개 AI 연산 유닛을 저지연 환경에서 효율적으로 동작시켜 거대 AI 모델 학습 및 추론을 지원한다. 최신 GPU 네트워크 인터페이스 카드(NIC)에 내장된 스위칭 기능을 활용해 동시에 여러 스위치들을 연결할 수 있게 해준다.
클레이 마고요크 오라클 CEO는 “고객은 클라우드 인프라스트럭처를 통해 더 빠르게 혁신하고, 더 효율적으로 운영하며, 확신을 가지고 확장하길 원한다. 오라클은 10년 이상 클라우드 네트워킹의 혁신을 주도해 왔으며, 이번 업데이트로 오라클 액셀러론은 어떠한 클라우드 워크로드에서도 성능, 확장성, 보안성을 모두 갖춘 인프라를 제공할 수 있게 됐다"고 말했다.

