[디지털투데이 황치규 기자]패브릭 기반 멀티모달 데이터 플랫폼 전문기업 미소정보기술은 의료 및 산업분야 대규모언어모델(LLM) AI 구축과 소규모언어모델(sLLM) AI 구축 시 빅데이터 확보에 필요한 비(非)라벨링 데이터 표준화 솔루션 ‘데이터스캔(Data Scan)’을 출시한다고 15일 밝혔다.

회사 측에 따르면 ‘데이터스캔’은 의료 및 산업분야에서 사람에 의해 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT등 초거대AI 개발에 필수인 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다. 

초거대AI 사전학습에 필요한 빅데이터 구축(텍스트)을 위해 데이터 등록부터 분류체계, 단어사전 구축 통한 자연어 처리 및 분류분석, 텍스트분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석한다.

 이동욱 미소정보기술 대표는 “생성형AI시대를 맞아 양질의 데이터는 AI경쟁력의 핵심"이라며 "의료, 산업 데이터분석 및 멀티모달 데이터 플랫폼으로 양질의 데이터를 제공해 초거대AI 기업들 경쟁력을 지원하는 데이터 인에이블러(Data Enabler)역할을 담당할 것”이라고 말했다.
 

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지