Crowdworksは2月24日、政府の「独自AI基盤モデル」事業に参加するMotif Technologiesコンソーシアムへ、データ供給の中核パートナーとして参画すると発表した。3000億パラメータ級の推論型LLM向け学習データの構築を担う。
同社は同事業で、Motif Technologiesコンソーシアムが開発を進める3000億パラメータ級の推論型大規模言語モデル(LLM)向けの学習データを整備する。単なるデータ加工にとどまらず、モデルの論理的思考力を高めるChain-of-Thought特化型の学習データセット構築に注力する。
あわせて、自社開発の非構造化文書データ前処理ソリューション「Alpy Knowledge Compiler」も活用する。表やチャートなど複雑な構造を持つ非構造化文書を高精度に解析し、AIが理解可能な形式へ変換する。
Crowdworksは「推論型LLMの性能は、どれだけ論理的で精緻なデータを学習できるかに左右される」とコメント。「国内大手テック企業との協業で検証したデータ精製技術を結集し、独自AIモデルの開発を支えていく」としている。
著者について