딥시크 모델들은 AMD LM 스튜디오를 통해 설치하고 실행할 수 있다. [사진: AMD]
딥시크 모델들은 AMD LM 스튜디오를 통해 설치하고 실행할 수 있다. [사진: AMD]

[디지털투데이 석대건 기자] AMD가 자사 프로세서와 그래픽카드에서 고성능 AI 추론 모델을 구동하는 가이드를 공개했다.

AMD는 자사 라이젠 AI 프로세서와 라데온 그래픽카드를 활용해 딥시크 R1 증류 추론 모델(DeepSeek R1 Distilled Reasoning)을 실행하는 방법을 31일 소개했다.

이번 가이드는 사용자들이 고성능 AI 추론 작업을 로컬 환경에서 쉽게 수행할 수 있도록 지원한다.

딥시크 R1은 체인오브소트(Chain-of-Thought, CoT) 추론 방식을 활용해 복잡한 작업을 처리하는 대규모 언어 모델(LLM)이다. 이 모델은 최종 답변을 제시하기 전에 '사고' 단계를 거치며, 문제 해결을 위한 상세한 분석 과정을 사용자에게 제시한다.

AMD는 하드웨어 성능에 따라 최적화된 모델 선택 가이드를 제시했다. 구체적으로 라이젠 AI 맥스+ 395 32GB, 64GB, 128GB 모델은 최대 70B 규모의 딥시크 R1 증류 모델을 지원한다. 라이젠 AI HX 370과 365 시리즈는 14B 모델까지, 라이젠 8040과 7040 시리즈는 14B 라마 모델까지 구동할 수 있다.

라데온 그래픽카드의 경우 RX 7900 XTX는 32B 규모의 모델을, RX 7900 XT부터 RX 7600 XT까지는 14B 모델을 지원한다. RX 7600은 8B 라마 모델까지 실행이 가능하다. AMD는 모든 모델에 대해 Q4 K M 양자화 방식을 권장했다.

이 모델들은 LM 스튜디오를 통해 설치하고 실행할 수 있다. AMD는 아드레날린 25.1.1 이상의 드라이버를 설치한 후 LM 스튜디오 0.3.8 버전 이상을 사용할 것을 권장했다. 설치 과정은 드라이버 설치, LM 스튜디오 다운로드, 모델 선택, GPU 오프로드 레이어 설정 등 10단계로 구성된다. 

AMD 관계자는 "AMD 하드웨어에 따라 각 모델은 라이젠 AI 프로세서나 라데온 그래픽카드에서 최신 추론 기능을 제공할 것"이라고 말했다.

프로세서 지원 DeepSeek R1 Distill 모델
라이젠 AI 맥스+ 395 32GB, 64GB, 128GB DeepSeek-R1-Distill-Llama-70B (64GB, 128GB)
DeepSeek-R1-Distill-Qwen-32B
라이젠 AI HX 370, 365 24GB, 32GB DeepSeek-R1-Distill-Qwen-14B
라이젠 8040, 7040 32GB DeepSeek-R1-Distill-Llama-14B
그래픽카드 지원 DeepSeek R1 Distill 모델
라데온 RX 7900 XTX DeepSeek-R1-Distill-Qwen-32B
라데온 RX 7900 XT
라데온 RX 7900 GRE
라데온 RX 7800 XT
라데온 RX 7700 XT
라데온 RX 7600 XT
DeepSeek-R1-Distill-Qwen-14B
라데온 RX 7600 DeepSeek-R1-Distill-Llama-8B

키워드

#AMD #딥시크
저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사