Một nghiên cứu mới cho thấy kể từ khi ChatGPT ra mắt vào năm 2022, khoảng 35% website mới trên Internet có khả năng được tạo bằng AI hoặc được biên soạn với sự hỗ trợ của AI.
Theo ITmedia ngày 11/5 (giờ địa phương), nhóm nghiên cứu đến từ Imperial College London (Anh), tổ chức phi lợi nhuận Internet Archive (Mỹ) và Đại học Stanford (Mỹ) đã công bố bài báo mang tên “The Impact of AI-Generated Text on the Internet”.
Nghiên cứu xem xét các website xuất hiện trong giai đoạn từ tháng 8/2022 đến tháng 5/2025, sử dụng dữ liệu lưu trữ từ dịch vụ Wayback Machine do Internet Archive vận hành.
Để hạn chế sai lệch do tập trung vào một số tên miền nhất định, nhóm nghiên cứu chọn ngẫu nhiên khoảng 10.000 URL mỗi tháng, trích xuất nội dung văn bản trên từng trang và phân loại bằng công cụ phát hiện văn bản do AI tạo.
Sau bước đánh giá đối chiếu ban đầu, nhóm chọn công cụ Pangram v3. Theo các nhà nghiên cứu, công cụ này duy trì độ chính xác cao và ổn định với cả văn bản dài lẫn ngắn, trên nhiều mô hình như GPT, Claude, Gemini và trong nhiều môi trường ngôn ngữ khác nhau.
Từ đó, nội dung được chia thành ba nhóm gồm: hoàn toàn do AI tạo, do con người viết nhưng có AI hỗ trợ, và hoàn toàn do con người viết.
Nhóm nghiên cứu cho biết trọng tâm không chỉ là đo tỷ lệ nội dung do AI tạo ra, mà còn là xác định Internet đang thay đổi ra sao dưới tác động của AI, trong bối cảnh nhận thức của người dùng có thể khác với những gì thực tế diễn ra trên web.
Trong các cuộc khảo sát, nhiều người lo ngại AI sẽ làm gia tăng thông tin sai lệch, đồng thời khiến văn phong cá nhân mờ nhạt dần và các bài viết ngày càng giống nhau.
Tuy nhiên, khi phân tích dữ liệu văn bản ở quy mô lớn, nhóm không tìm thấy bằng chứng rõ ràng cho thấy tính xác thực của thông tin trên toàn Internet suy giảm đáng kể. Hiện tượng đồng nhất hóa văn phong cũng không mạnh đến mức như cảm nhận phổ biến của người dùng.
Dù vậy, nghiên cứu ghi nhận hai thay đổi tương đối rõ nét. Thứ nhất là sự thu hẹp về đa dạng ngữ nghĩa: nhóm website do AI tạo có mức độ tương đồng về nội dung cao hơn 33% so với nhóm website do con người viết.
Theo nhóm tác giả, kết quả này phù hợp với xu hướng các mô hình AI thường tránh quan điểm cực đoan và ưu tiên những câu trả lời trung tính, an toàn. Điều đó cho thấy các góc nhìn đa dạng và ý tưởng độc đáo trên môi trường trực tuyến có thể đang bị thu hẹp.
Thay đổi thứ hai là xu hướng lệch mạnh theo hướng tích cực, còn được gọi là “positivity shift”. Điểm cảm xúc tích cực trong các website có yếu tố AI cao hơn 107% so với website do con người viết.
Nhóm nghiên cứu nhận định đây là hệ quả của việc AI thường ưu tiên lối diễn đạt sáng sủa, an toàn và ít gây phản cảm với người dùng.
Từ các kết quả này, nhóm cho rằng biến đổi hiện nay trên Internet khác với kịch bản “bùng nổ tin giả” mà nhiều người lo ngại. Theo họ, rủi ro cốt lõi không nằm ở việc lan truyền công khai những thông tin bịa đặt hay tin đồn, mà ở sự gia tăng của kiểu câu chữ mang màu sắc AI: an toàn, ít sắc cạnh và thiên về sắc thái tích cực.
Nói cách khác, văn bản trực tuyến đang dần trở nên nhân tạo hơn và đồng đều hơn về giọng điệu.
Những phát hiện này cho thấy AI tạo sinh không còn chỉ đóng vai trò là công cụ hỗ trợ viết, mà đã bắt đầu tác động trực tiếp đến cách diễn đạt trên quy mô toàn web. Nhóm nghiên cứu cho rằng trong thời gian tới, cần theo dõi không chỉ khối lượng nội dung do AI tạo ra, mà cả việc giọng điệu và góc nhìn nào đang dần trở thành chuẩn chung trên Internet.