新規公開サイトの35％にAI関与の可能性　英米研究

写真=Shutterstock。研究では、AI文章の広がりに加え、インターネット上の文章表現の変化も定量的に示した。

2022年のChatGPT登場以降、新たに公開されたWebサイトの約35％で、AIが生成した、またはAI支援を受けて作成された文章が使われた可能性がある――。Imperial College London、Internet Archive、Stanford Universityの研究チームは、こうした分析結果をまとめた論文「The Impact of AI-Generated Text on the Internet」を公表した。

分析対象は、2022年8月から2025年5月までに公開されたWebサイトだ。調査には、Internet Archiveが運営するWebアーカイブサービス「Wayback Machine」を利用した。特定ドメインへの偏りを避けるため、毎月約1万件のURLを無作為に抽出し、ページ本文のテキストを取り出してAI文章検出ツールで分類した。

検出ツールには、比較評価の結果を踏まえて「Pangram v3」を採用した。研究チームによると、長文・短文の違いや、GPT、Claude、Geminiといった異なるモデル、複数言語の環境でも高い精度を示したという。そのうえで、テキストを「完全なAI生成」「AI支援を受けた人間作成」「完全な人間作成」の3区分に分けて分析した。

今回の研究は、AI文章の比率だけでなく、インターネット上の文章表現がどう変化しているかにも焦点を当てた。研究チームによれば、利用者アンケートでは「AIの影響で誤情報が増えた」「個人独自の文体が薄れ、似たような文章が増えた」といった懸念が目立った。

一方、大規模なWebテキスト分析では、インターネット全体で事実の正確性が明確に悪化したことを示す証拠は確認できなかった。文体の均質化についても、利用者の実感ほど明瞭ではないとしている。

それでも、比較的はっきり表れた変化が2つあった。1つは、意味的多様性の低下だ。AI生成サイト群は、人間が執筆したサイト群に比べ、内容の類似性が33％高かった。研究チームは、AIが極端な見解を避け、平均的で無難な回答を返しやすい傾向が、この結果に反映されたとみている。オンライン空間で、多様な視点や独創的な発想が細る可能性を示す結果だとしている。

もう1つは、研究チームが「ポジティビティ・シフト」と呼ぶ傾向だ。AI生成が関与したサイトでは、肯定的な感情スコアが人間作成のサイトより107％高かった。AIが利用者に拒否感を与えにくい、明るく無難な表現を選びやすい傾向が表れたと分析している。

研究チームは、現在のインターネットで起きている変化は、偽情報の爆発的な増加というより、AI特有の文体が広がる方向に近いと指摘する。問題の中心は、露骨な虚偽情報の拡散ではなく、大胆さに欠け、過度に明るい文章が増えることにあるという。オンライン上の文章が、人工的で均質な方向へ変化しつつあるとの見方だ。

こうした結果は、生成AIが単なる文章作成支援にとどまらず、Web全体の表現様式そのものに影響を及ぼし始めていることを示している。今後は、AIが生み出す情報量だけでなく、どのような語調や視点がインターネット上の標準として定着していくのかも検証課題になりそうだ。

Jinju Hong (홍진주) hongjj@d-today.co.kr

キーワード