![딥시크(Deepseek) [사진: 셔터스톡]](https://cdn.digitaltoday.co.kr/news/photo/202510/600868_557408_1641.jpg)
[디지털투데이 AI리포터] 중국 인공지능(AI) 기업 딥시크가 AI 메모리 저장 방식을 혁신할 새로운 접근법을 발표했다.
29일(현지시간) MIT 테크놀로지 리뷰에 따르면 지난주 공개된 이 광학문자인식(OCR) 모델은 이미지에서 텍스트를 추출해 기계가 읽을 수 있는 단어로 변환하는 기술로, 기존 스캐너 앱, 사진 번역, 접근성 도구에 활용되는 것과 유사한 방식이다.
기존 AI 모델들은 텍스트를 수천 개의 토큰으로 변환해 저장하지만, 이 방식은 시간이 지날수록 연산 비용이 증가해 문맥 부패(context rot) 문제가 발생한다. 딥시크는 텍스트 대신 이미지 형태로 정보를 저장해 더 적은 토큰을 사용하면서도 동일한 정보를 유지하는 방식을 제안했다.
이 방식은 인간의 기억과 유사한 계층적 압축을 적용해 오래되거나 덜 중요한 정보를 흐릿하게 저장하면서도 필요 시 즉시 접근할 수 있도록 설계됐다. 이에 대해 AI 연구자들은 "텍스트 기반 토큰이 비효율적일 수 있다"며 새로운 접근법에 주목하고 있다.
또한 만링 리(Manling Li) 노스웨스턴대 컴퓨터과학 조교수는 "이미지 기반 토큰이 기존 AI 메모리 문제를 해결할 가능성을 보여준다"고 평가했다. 특히 AI와의 대화가 연속적으로 이어지는 상황에서 이 기술이 더 유용할 것이라는 분석도 나오고 있다.
딥시크의 연구는 AI 훈련 데이터를 생성하는 데도 활용될 수 있다. 현재 AI 모델 개발자들은 고품질 텍스트 부족 문제를 겪고 있지만, 딥시크의 OCR 시스템은 단일 GPU로 하루 20만 페이지 이상의 훈련 데이터를 생성할 수 있다고 밝혔다.
다만, 이는 초기 연구 단계로 향후 시각적 토큰을 기억 저장뿐 아니라 추론에도 적용하는 방향이 논의되고 있다. AI 메모리가 인간처럼 중요한 순간을 오래 기억하고 사소한 정보를 잊는 방식으로 발전할 수 있을지 주목된다.

