Crowdworks企业标识。图片来源:Crowdworks

AI技术公司Crowdworks于24日宣布,已以核心数据供应伙伴身份加入Motif Technologies联盟,参与韩国政府推进的独立AI基础模型项目。

根据介绍,Crowdworks将在该项目中承担Motif Technologies联盟正在开发的3000亿参数级推理型大语言模型训练数据构建工作。公司表示,除基础数据处理外,还将重点打造面向分步推理(Chain-of-Thought)的专项训练数据集,以提升模型的逻辑推理能力。

与此同时,Crowdworks还将引入自研的非结构化文档数据预处理解决方案“Alpy Knowledge Compiler”。该方案可对表格、图表等结构复杂的非结构化文档进行精细解析,并将其转化为模型可处理的格式。

Crowdworks方面表示,推理型大语言模型的性能表现,取决于训练数据是否具备足够的逻辑性与精细度。公司将整合在与韩国本土大型科技企业合作过程中验证过的数据精炼技术,为独立AI基础模型开发提供支撑。

关键词

#Crowdworks #Motif Technologies联盟 #独立AI基础模型 #3000亿参数级 #推理型大语言模型 #Chain-of-Thought #训练数据 #非结构化文档预处理
版权所有 © DigitalToday。未经授权禁止转载或传播。