Crowdworksは3月4日、非構造文書をRAG向けデータに変換するAIデータパーサー「Alpy Knowledge Compiler」のデモを公開した。あわせて、金融分野でCPU環境を用いて150万件超の非構造文書を変換した導入事例も明らかにした。
「Alpy Knowledge Compiler」は、社内の複数システムに分散している非構造文書を、RAGに対応したAIサービスで活用しやすい形式へ変換するソリューション。文書の複雑さを定量評価する特許技術を基に、自動処理が可能な文書と、専門家による精密な解析が必要な文書を事前に分類する。これにより、大量の文書を扱う環境でも、前処理の効率化とデータ品質の両立を図れるとしている。
金融分野での適用事例も公表した。同社によると、最近は国内の金融会社向けに、CPU環境で150万件超の非構造文書をRAG向けデータへ変換するプロジェクトを完了した。オンプレミスとクラウドの両環境に対応しており、高いセキュリティ要件が求められる企業でも導入できると説明している。
Crowdworksの関係者は「AI時代では、どれほど優れたモデルを使うかよりも、どれだけ適切に設計されたデータを持っているかが競争力を左右する」とコメントした。
著者について