GDELT Projectは、AIを活用して膨大なニュースや政策文書を分析する実験を公開した。65言語のニュースをリアルタイムで翻訳する仕組みに加え、過去25年分のテレビニュース約300万本の翻訳や、約3100ページに及ぶ米法案のインフォグラフィック化にも取り組んでいる。
Gigazineが現地時間15日に伝えたところによると、GDELT Projectは、放送、新聞、Webニュースなど、世界100以上の言語で発信されるコンテンツを継続的に収集してデータベース化するグローバルアーカイブだ。人物や組織、場所、出来事、報道ソースなどを関連付けて整理し、世界で起きている事象の背景や世論の流れをデータとして提供している。
同プロジェクトは、データサイエンティストのカレフ・リタル氏と政治学者のフィリップ・シュロット氏が設立した。1979年から現在までのニュースやソーシャルメディアデータを収集しているという。
収集したデータは、社会的な出来事とその反応を定量データとして符号化し、世界の政治、経済、社会の動向を分析する基盤として活用される。
GDELTは大規模データセットを公開しており、研究者やジャーナリストが分析に利用できる。データは、世界の物理的活動を300以上のカテゴリに分類したイベントデータ、人・組織・場所・テーマ・感情などを記録する関係データ、ニュース画像の視覚的なストーリーを分析したデータの3つで構成される。
更新頻度はおおむね15分ごととしている。
また、独自の翻訳システムを使い、65言語のグローバルニュースをリアルタイムで翻訳・処理する「translingual platform」も運用している。
近年はAIを使った分析実験も進めている。GDELT ProjectはGeminiベースのモデルを用い、世界のニュースから政府や企業のリーダー交代に関する発表を自動抽出し、知識グラフとして整理する実験を公開した。
この過程では、人事情報の整理にとどまらず、政治・経済面の背景も推定し、レポート生成に活用したという。
別の実験では、約3100ページに及ぶ米国の国防授権法をAIに入力し、法案全体を1枚のインフォグラフィックにまとめた。テーマ分析や関連法案の整理、想定問答の生成もあわせて実施した。
大規模翻訳の実験も公表している。2026年2月の発表によると、過去25年分のテレビニュース約300万本をAIで翻訳した。
翻訳対象は計620億文字、放送時間にして約60億秒分で、費用は約7万4634ドル。従来手法なら数百万ドル規模の費用がかかったとみられる作業だとしている。
一連の取り組みは、AIが膨大なニュースや政策文書を横断的に分析できる可能性を示す事例といえそうだ。データに基づく分析は、今後のグローバルな政治・経済動向を読み解く手法の1つとなる可能性がある。