Minh họa về harness engineering. Ảnh: ChatGPT

Sự phổ biến nhanh của các công cụ lập trình bằng trí tuệ nhân tạo đang kéo theo sự chú ý dành cho “harness engineering” - khái niệm chỉ cách thiết kế ngữ cảnh, công cụ và quy trình để AI làm việc hiệu quả hơn. Trong giới phát triển phần mềm, đây ngày càng được xem là kỹ năng cốt lõi để “dùng AI đúng cách”.

Trao đổi với phóng viên, An Su-bin, kỹ sư nghiên cứu tại Asteromorph, cho biết có thể hiểu harness engineering là cách “gắn tay chân cho AI để làm việc”. Asteromorph hiện phát triển các mô hình AI phục vụ giới khoa học.

Thuật ngữ này bắt nguồn từ “harness”, nghĩa là dây cương. Ý tưởng cốt lõi là đặt AI vào một khuôn khổ vận hành phù hợp, qua đó định hướng mô hình thực hiện công việc theo mục tiêu mong muốn.

Theo An Su-bin, để hiểu đúng khái niệm này cần nhìn vào cấu trúc của một tác vụ AI. Một quy trình điển hình thường gồm bốn phần: LLM đóng vai trò “bộ não”, đi cùng khâu lập kế hoạch, bộ nhớ và khả năng sử dụng công cụ. Khung khái niệm này được Lilian Weng, cựu Phó chủ tịch nghiên cứu của OpenAI, hệ thống hóa trong bài viết năm 2023 “LLM Powered Autonomous Agents”. Trong mô hình đó, lập trình viên giữ vai trò điều phối, quyết định LLM sẽ làm gì, làm như thế nào và theo trình tự nào.

Thay vì can thiệp vào quá trình huấn luyện mô hình, các chỉ dẫn được đưa vào thông qua cửa sổ ngữ cảnh của LLM. Lập trình viên có thể thiết lập quy tắc cố định bằng system prompt, giới hạn phạm vi truy xuất bằng RAG, đồng thời kết nối thêm các công cụ như tìm kiếm, máy tính, API, trình thực thi mã hay lịch. Kết quả từ các công cụ này sau đó lại được đưa trở lại làm đầu vào cho mô hình. Đầu ra từ những tác nhân khác cũng có thể được đưa vào chu trình đó. Toàn bộ quá trình thiết kế và điều phối này chính là phạm vi của harness engineering.

Ở phạm vi rộng hơn, ngành này còn dùng khái niệm “context engineering”. Nếu harness engineering nghiêng nhiều về việc thiết lập môi trường vận hành cho AI, thì context engineering tập trung vào thiết kế toàn bộ đầu vào được truyền vào LLM.

Khi tích lũy đủ kinh nghiệm, lập trình viên có thể đóng gói cách làm này thành những đơn vị có thể tái sử dụng, gọi là “skill”. Theo An Su-bin, đây là quá trình biến tri thức ngầm trong công việc lập trình thành tri thức có thể mô tả rõ ràng, từ quy ước viết mã đến cấu trúc prompt và thông tin bối cảnh.

Khái niệm skill đang lan nhanh trong cộng đồng phát triển, đặc biệt sau khi Vercel ra mắt nền tảng skills.sh vào tháng 1. Trước đó, Anthropic đã công bố định dạng skill như một tiêu chuẩn mở vào tháng 12/2025. Gần đây, thị trường còn xuất hiện “skill creator” - công cụ tự tạo skill. AI có thể phân tích thói quen làm việc hoặc các prompt sẵn có để tự đóng gói thành mẫu tái sử dụng. Codex, Claude Code và nhiều công cụ lập trình bằng AI khác đã cung cấp tính năng này dưới dạng plugin.

Song song với đó, trong cộng đồng phát triển cũng xuất hiện xu hướng chú trọng nhiều hơn vào bản thân mô hình thay vì chỉ tập trung vào skill, nhằm nâng chất lượng đầu ra khi làm việc với AI. Một số ý kiến cho rằng hiệu quả của skill cuối cùng vẫn phụ thuộc vào năng lực của mô hình. Vì vậy, kỹ thuật sử dụng AI đang dần dịch chuyển từ việc điều khiển hành vi của LLM sang cách phối hợp nhiều mô hình với nhau.

Đó cũng là bối cảnh khiến khái niệm “multi-agent” nổi lên. Mô hình này dựa trên sự phối hợp của nhiều tác nhân AI, trong đó mỗi tác nhân đảm nhiệm một vai trò riêng để hoàn thành nhiệm vụ chung. Cách triển khai cũng khá đa dạng. Một trong những cấu trúc do Anthropic giới thiệu là “Orchestrator-Workers”, nơi một tác nhân trung tâm tiếp nhận nhiệm vụ, phân rã công việc và phân công cho các tác nhân cấp dưới. Khi có mục tiêu cụ thể, AI sẽ tự chọn quy trình phù hợp. Ngoài ra còn có các mô hình như prompt chaining, routing, xử lý song song, hay đánh giá - tối ưu hóa.

Thậm chí, một số lập trình viên còn dự báo thời của harness có thể dần qua đi để nhường chỗ cho “Ralph Wiggum Loop”. Kỹ thuật này do lập trình viên Geoffrey Huntley đề xuất vào tháng 7/2025, lấy tên từ nhân vật Ralph Wiggum trong loạt phim hoạt hình “The Simpsons”. Cốt lõi của phương pháp là lặp đi lặp lại cùng một tác vụ cho đến khi đạt điều kiện dừng, nhằm tạo ra kết quả mong muốn mà không cần thiết kế một cấu trúc quá phức tạp.

Từ khóa

#trí tuệ nhân tạo #lập trình bằng AI #LLM #harness engineering #context engineering #skills.sh #multi-agent
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.