![딥시크(deepseek) [사진: 셔터스톡]](https://cdn.digitaltoday.co.kr/news/photo/202509/594806_552702_4843.jpg)
[디지털투데이 황치규 기자]중국 기반 AI 기업 딥시크(DeepSeek)가 긴 맥락 작업에서 추론 비용을 크게 낮춘 'V3.2-exp' 모델을 발표했다고 테크크런치가 29일(현지시간) 보도했다.
이 모델은 '스파스 어텐션(Sparse Attention)' 기술을 적용해 긴 맥락에서도 서버 부하를 최소화하며, 특정 토큰만 선택해 처리하는 방식으로 작동한다. 이를 통해 장문을 다루는 작업에서 API 호출 비용을 최대 절반까지 줄일 수 있다는 것이 딥시크 설명이다.
딥시크는 올해 초 강화학습을 활용한 'R1' 모델로 주목받았지만, 이후 AI 업계에서 관심은 수그러들었다.
‘스파스 어텐션’은 R1만큼 반향을 일으킬 것 같지는 않지만 여전히 미국 공급 업체들에게 추론 비용을 낮게 유지하는 데 필요한 기술들을 가르쳐 줄 수 있다고 테크크런치는 전했다.

