![로고 [사진: 디노티시아]](https://cdn.digitaltoday.co.kr/news/photo/202504/560544_524817_1618.jpg)
[디지털투데이 석대건 기자] 디노티시아가 한양대학교 AIHA 연구실과 산학협력을 통해 AI 양자화 알고리즘 평가 플랫폼 'QLLM-INFER'를 깃허브에 오픈소스로 공개했다고 8일 밝혔다.
이번 플랫폼은 표준화된 환경에서 알고리즘 성능을 정확히 비교할 수 있다. 그동안 다양한 양자화 알고리즘이 서로 다른 환경과 조건에서 평가돼 객관적인 비교가 어려웠다.
양자화는 AI 모델의 계산 정밀도를 낮춰 처리 속도를 향상시키는 기술이다. 큰 숫자를 작은 숫자로 압축하는 방식으로, AI 모델이 원래 성능을 유지하면서도 메모리 사용량과 연산 속도를 크게 줄일 수 있다.
양사는 최근 3년(2022~2024년) 동안 주목받은 양자화 기술 8가지를 선정해 동일한 조건에서 객관적으로 평가했다. 이 플랫폼은 가중치와 활성화 값을 모두 줄이는 방식, 가중치만 줄이는 방식, AI가 긴 입력을 처리할 때 임시 저장하는 공간(KV 캐시)을 줄이는 방식 등 세 가지 유형으로 나눠 알고리즘 성능을 분석했다고 회사 측은 설명했다.
정무경 디노티시아 대표는 "LLM서비스가 널리 상용화되기 위해서는 양자화를 통한 모델 경량화가 필수적이지만, 어떤 양자화 기술이 타겟 응용과 시스템에 더 유효한 지 판단이 어렵다"며 "'QLLM-INFER'는 양자화 알고리즘의 성능을 객관적이고 투명하게 비교할 수 있는 오픈소스 플랫폼으로, 최적의 양자화 솔루션을 선택하거나 새로운 양자화 기술을 개발할 때 큰 도움을 줄 것"이라고 강조했다.
최정욱 한양대학교 융합전자공학과 교수는 "지금까지 양자화 기술은 연구마다 기준이 달라 객관적 비교가 어려웠다"며 "이번 플랫폼은 AI 연구에 처음으로 표준화된 평가 기준을 제시했다는 점에서 학문적으로 의미가 크며, AI 연구자들이 이 플랫폼을 통해 더욱 객관적이고 신뢰성 높은 연구 성과를 낼 수 있을 것으로 기대한다"고 말했다.
이 플랫폼은 아파치 2.0 라이선스를 적용해 누구나 자유롭게 사용하고 기여할 수 있다. 디노티시아는 최근 한국어 AI 연구 활성화를 위해 한국어 논리 추론 AI모델인 'DNA-R1'을 오픈소스로 공개하기도 했다.
키워드
#디노티시아SNS 기사보내기
관련기사
- NHN클라우드, 디노티시아와 공공·민간 AI 클라우드 사업 협력
- 디노티시아, RAG 최적화 AI 추론 시스템 개발 추진
- 디노티시아, 한국어 최적화 추론 AI 모델 DNA-R1 공개
- 디노티시아-파인더스, 보험 AI 솔루션 공동개발 협약
- 디노티시아, 80억 파라미터 AI 모델 오픈소스로 공개
- 디노티시아, 연산 전용 칩 탑재 차세대 벡터DB 시스템 '씨홀스' 공개
- 반도체 업계, 엔터프라이즈 AI 정조준...벡터DB 기술 개발 활발
- 디노티시아, 벡터DB SW '씨홀스' 클라우드 웹버전 출시
- '작은 AI, 큰 성능'...디노티시아 "미래는 거대 모델 아닌 데이터 시스템"
- 디노티시아, CB 인사이트 '글로벌 AI 100' 선정
- 디노티시아, 북미서 온디바이스 LLM '니모스' 첫 공개
- 디노티시아·누리인포스, AI 솔루션 공동개발 MOU
- 유일하이스트, 한양대와 서울시 RISE 협력 위한 업무 협약 체결

