画像=Crowdworks

Crowdworksは2月24日、政府の「独自AI基盤モデル」事業に参加するMotif Technologiesコンソーシアムへ、データ供給の中核パートナーとして参画すると発表した。3000億パラメータ級の推論型LLM向け学習データの構築を担う。

同社は同事業で、Motif Technologiesコンソーシアムが開発を進める3000億パラメータ級の推論型大規模言語モデル(LLM)向けの学習データを整備する。単なるデータ加工にとどまらず、モデルの論理的思考力を高めるChain-of-Thought特化型の学習データセット構築に注力する。

あわせて、自社開発の非構造化文書データ前処理ソリューション「Alpy Knowledge Compiler」も活用する。表やチャートなど複雑な構造を持つ非構造化文書を高精度に解析し、AIが理解可能な形式へ変換する。

Crowdworksは「推論型LLMの性能は、どれだけ論理的で精緻なデータを学習できるかに左右される」とコメント。「国内大手テック企業との協業で検証したデータ精製技術を結集し、独自AIモデルの開発を支えていく」としている。

キーワード

#Crowdworks #Motif Technologies #AI #大規模言語モデル #LLM #推論型 #Chain-of-Thought #学習データ
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.