Prompt “bạn là chuyên gia” có thể làm giảm độ chính xác của LLM

Prompt gán vai “chuyên gia” cho mô hình AI có thể làm suy giảm hiệu năng trong một số tác vụ. Ảnh: Shutterstock

Một nghiên cứu mới cho thấy cách viết prompt theo kiểu “bạn là chuyên gia trong lĩnh vực này” không phải lúc nào cũng giúp mô hình ngôn ngữ lớn hoạt động tốt hơn. Trong nhiều trường hợp, đặc biệt với các tác vụ như lập trình và toán học, cách gán vai này còn có thể làm giảm độ chính xác.

Theo Gigazine ngày 3/5/2026, nhóm nghiên cứu do Hu Zizhao tại Đại học Nam California thực hiện đã thử nghiệm prompt gán vai chuyên gia trên 6 mô hình AI và ghi nhận hiệu năng suy giảm ở một số nhóm tác vụ.

Trước đó, nhiều nghiên cứu từng cho rằng việc gán cho AI một vai trò chuyên gia phù hợp với nhiệm vụ có thể cải thiện chất lượng câu trả lời. Chẳng hạn, nếu yêu cầu giải thích về chim, mô hình được đặt vào vai chuyên gia về chim có thể cho kết quả tốt hơn so với khi mang vai chuyên gia ôtô. Từ nhận định này, không ít tài liệu hướng dẫn đã khuyến khích người dùng để mô hình “đóng vai chuyên gia” ngay từ đầu.

Trong nghiên cứu mới, nhóm của Hu Zizhao áp dụng nhiều dạng prompt khác nhau trên 6 mô hình, trong đó có Llama-3.1-8B và Qwen2.5-7B, rồi đối chiếu kết quả qua các bộ benchmark. Các prompt được thử nghiệm gồm cả dạng ngắn như “bạn là kỹ sư phần mềm” lẫn dạng dài nhấn mạnh chuyên môn sâu và nhiều năm kinh nghiệm trong một lĩnh vực.

Kết quả cho thấy tác động của prompt gán vai chuyên gia phụ thuộc vào từng loại bài toán. Trên MT-Bench, bộ đánh giá năng lực hội thoại nhiều lượt, các prompt chuyên gia phức tạp có cải thiện nhất định ở các tác vụ viết và suy luận. Tuy nhiên, ở lập trình, toán học và nhân văn, chất lượng đầu ra lại giảm. Trên MMLU, bộ đo kiến thức tổng quát, nhóm nghiên cứu cũng ghi nhận mức suy giảm hiệu năng trên diện rộng. Theo nhóm này, chỉ riêng việc thêm chỉ dẫn “bạn là chuyên gia” không bảo đảm mô hình sẽ trả lời tốt hơn.

Một trong những nguyên nhân được nhóm nghiên cứu đưa ra là cách mô hình phân bổ tài nguyên xử lý. Theo Hu Zizhao, khi bị yêu cầu phải “trở thành chuyên gia”, mô hình có thể dành bớt năng lực vốn dùng để truy xuất thông tin chính xác sang việc tuân thủ vai diễn trong prompt. Nói cách khác, mô hình không tạo ra tri thức mới, nhưng vẫn tiêu tốn tài nguyên tính toán để đáp ứng yêu cầu mang tính hình thức, từ đó khiến độ chính xác dao động.

Kết quả ở mảng lập trình đặc biệt đáng chú ý vì đi ngược với quan niệm phổ biến. Nhóm nghiên cứu cho biết ngay cả khi yêu cầu AI “bạn là lập trình viên lành nghề”, chất lượng hoặc tính hữu ích của mã tạo ra cũng không tăng rõ rệt. Theo họ, việc mô tả cụ thể yêu cầu dự án sẽ hiệu quả hơn trong việc tạo ra đoạn mã phù hợp với nhu cầu người dùng. Nói cách khác, nêu rõ điều kiện công việc và tiêu chí đầu ra có ích hơn so với chỉ gán vai.

Dù vậy, prompt gán vai chuyên gia không hoàn toàn mang lại tác động tiêu cực. Nghiên cứu cũng ghi nhận cách làm này có thể cải thiện khả năng căn chỉnh của AI, nhất là trong việc kiểm soát phản hồi theo các chuẩn mực đạo đức của con người. Trên JailbreakBench, bộ đánh giá khả năng ngăn phản hồi phi đạo đức, hiệu quả được cải thiện đáng kể. Điều này cho thấy độ chính xác và mức độ căn chỉnh không phải lúc nào cũng tăng hoặc giảm cùng nhau.

Phát hiện trên có thể ảnh hưởng đến cách người dùng thiết kế prompt. Trước đây, không ít người tin rằng việc gán sẵn một “danh tính chuyên gia” sẽ giúp mô hình hoạt động tốt hơn, từ đó hình thành nhiều hướng dẫn sử dụng theo hướng này. Tuy nhiên, thử nghiệm mới cho thấy cách tiếp cận đó có thể phản tác dụng tùy theo tác vụ.

Theo nhóm nghiên cứu, với những công việc đòi hỏi đáp án chính xác như hỗ trợ lập trình hay giải toán, việc nêu rõ định dạng đầu ra, các ràng buộc và yêu cầu cụ thể của bài toán có thể hiệu quả hơn so với nhấn mạnh “vai chuyên gia”. Ngược lại, trong các môi trường ưu tiên kiểm soát an toàn, prompt gán vai chuyên gia vẫn có thể là một công cụ hỗ trợ hữu ích.

Nghiên cứu kết luận rằng yếu tố quan trọng trong thiết kế prompt không nằm ở việc mô hình được giao vai gì, mà ở mức độ rõ ràng của yêu cầu nhiệm vụ. Với các tác vụ càng cần độ chính xác cao, việc xác định cụ thể phạm vi vấn đề, định dạng đầu ra và tiêu chí đánh giá nhiều khả năng sẽ cho kết quả ổn định hơn so với những chỉ dẫn chung chung như “hãy trả lời như một chuyên gia”.

Yoonseo Lee yslee@d-today.co.kr

Prompt “bạn là chuyên gia” có thể làm giảm độ chính xác của LLM

Thử nghiệm trên 6 mô hình cho thấy cách gán vai chuyên gia không hiệu quả với mọi tác vụ, đặc biệt ở lập trình và toán học

Đang tạo...

Tóm tắt AI

Nghiên cứu của Đại học Nam California trên 6 mô hình AI cho thấy prompt gán vai chuyên gia có thể làm giảm hiệu năng ở các bài toán cần độ chính xác cao như lập trình và toán học.

Từ khóa