EliceGroupは1月29日、複雑な形式の文書をAIで自動解析し、構造化データに変換する文書解析ソリューション「Helpy Document Vision」を発表した。
同社はAIインフラやクラウド、産業別ソリューションを手がける。今回のHelpy Document Visionでは、本文テキストに加え、表、チャート、数式、画像といった多様な視覚要素を自動で解析できるとしている。
同社によると、「Helpy Table Vision」は、Helpy Document Visionの機能の一つとして、製造業の大手企業などが扱う複雑な表データの解析に強みを持つ。社内データと学習インフラを組み合わせることで、金融、医療、法務など分野ごとの特殊な文書に合わせた迅速な最適化が可能だという。
EliceGroupは、今回活用した視覚言語モデル(VLM)技術を、文書認識にとどまらず、状況判断や行動実行まで担う視覚言語行動モデル(VLA)へ発展させる計画も明らかにした。
VLAは、AIが複雑なマニュアルや図面を読み取り、実際の産業現場でロボットや機械を精密に制御できるよう支援する技術だ。
EliceGroupのキム・スインCROは、「EliceのAI文書解析ソリューションによって、これまで手作業で処理していた複雑な文書を高品質なデータへ転換し、企業が実効性のある業務自動化を実感できるよう支援していく」とコメントした。
そのうえで、「単に文書を読むVLMを超え、実際の行動につながるVLAへと高度化することで、産業現場の課題を直接解決する『フィジカルAI』の時代をリードしたい」と述べた。