Andrej Karpathy gợi ý xây kho tri thức AI cá nhân theo mô hình 3 thư mục

Andrej Karpathy. Ảnh: từ website cá nhân của Andrej Karpathy

Andrej Karpathy, đồng sáng lập OpenAI và là người phổ biến khái niệm “vibe coding”, vừa chia sẻ một mô hình tối giản để xây dựng kho tri thức cá nhân bằng AI. Theo hướng dẫn do ông đăng trên mạng xã hội X, người dùng không cần phần mềm hay cơ sở dữ liệu chuyên dụng, mà chỉ cần ba thư mục và một tệp văn bản.

Cốt lõi của mô hình này là cấu trúc càng đơn giản càng tốt. Karpathy đề xuất tạo ba thư mục con trong thư mục dự án, gồm raw, wiki và outputs.

Trong đó, raw là nơi lưu toàn bộ tài liệu gốc. Người dùng có thể đưa vào đây bài viết, ghi chú, ảnh chụp màn hình, biên bản cuộc họp, bài nghiên cứu hay các tư liệu khác mà không cần đổi tên hoặc sắp xếp trước.

Với bài viết dạng văn bản, nội dung có thể được lưu dưới dạng tệp Markdown (.md) hoặc tệp văn bản (.txt). Ảnh chụp màn hình, biểu đồ và các dữ liệu hình ảnh khác thì giữ nguyên ở định dạng ảnh.

Thư mục wiki là nơi AI đọc dữ liệu từ raw rồi tổng hợp lại theo cấu trúc có hệ thống. Trong khi đó, outputs dùng để lưu các câu trả lời, báo cáo và kết quả phân tích do AI tạo ra.

Sau khi thiết lập ba thư mục, bước tiếp theo là tạo một tệp hướng dẫn trong thư mục dự án, có thể đặt tên là CLAUDE.md hoặc AGENTS.md. Theo Karpathy, đây là tệp giúp AI hiểu kho tri thức được tổ chức ra sao và cần xử lý nội dung theo nguyên tắc nào.

Nội dung của tệp này không cần dài. Người dùng chỉ cần nêu vai trò của từng thư mục, quy tắc viết wiki và danh sách các chủ đề quan tâm. Chẳng hạn, mỗi chủ đề trong wiki là một tệp riêng, phần đầu tệp có đoạn tóm tắt ngắn và các chủ đề liên quan được liên kết với nhau.

Dựa trên các chỉ dẫn đó, AI sẽ chuyển tài liệu trong raw thành nội dung có cấu trúc trong wiki. Khi dữ liệu trong raw tích lũy đủ nhiều, người dùng có thể kết nối các công cụ lập trình dùng AI như Claude Code hoặc Cursor với thư mục dự án, sau đó yêu cầu hệ thống viết wiki.

AI sẽ quét toàn bộ dữ liệu trong raw, tạo các tệp wiki theo từng chủ đề và tự động sinh tệp chỉ mục.

Karpathy cho rằng người dùng không cần trực tiếp chỉnh sửa wiki, mà chủ yếu đọc, đặt câu hỏi và để AI đảm nhiệm việc cập nhật. Khi wiki có từ 10 tài liệu trở lên, hệ thống bắt đầu có thể phát huy hiệu quả.

Theo ông, người dùng có thể đặt các câu hỏi như: “Hãy cho tôi biết ba điểm tôi chưa hiểu rõ nhất về chủ đề này” hoặc “A và B khác nhau thế nào trong khái niệm này”. AI sẽ đọc toàn bộ wiki để trả lời, sau đó lưu câu trả lời vào outputs để làm dữ liệu cho các truy vấn tiếp theo.

Karpathy cũng lưu ý rằng dữ liệu càng nhiều và càng được truy vấn thường xuyên thì chất lượng kho tri thức càng được cải thiện. Tuy nhiên, sai lệch cũng có thể tích tụ. Nếu AI tóm tắt sai và lưu nội dung đó vào wiki, các câu trả lời về sau có thể tiếp tục dựa trên thông tin sai. Đây cũng là điểm được nhiều người nhắc tới trong phần bình luận dưới bài đăng của ông.

Giải pháp Karpathy đưa ra là kiểm tra định kỳ mỗi tháng một lần. Người dùng có thể yêu cầu AI rà soát toàn bộ wiki để phát hiện các điểm mâu thuẫn, nhận định không có nguồn hoặc những chủ đề còn thiếu giải thích.

Dù nhiều ý kiến gợi ý kết hợp thêm plugin của Obsidian, Karpathy nhấn mạnh rằng chỉ cần đặt các tệp Markdown trong thư mục là đủ. Theo ông, AI không quá quan tâm người dùng mở tệp bằng ứng dụng nào; điều quan trọng hơn là cấu trúc thư mục và tệp hướng dẫn. Thay vì mất thời gian cấu hình các công cụ phức tạp, người dùng nên tập trung vào việc thu thập tài liệu và đặt câu hỏi.

Chi-gyu Hwang delight@d-today.co.kr

Andrej Karpathy gợi ý xây kho tri thức AI cá nhân theo mô hình 3 thư mục

Chỉ cần raw, wiki, outputs, cùng một tệp hướng dẫn để AI tự tổ chức và truy xuất tri thức

Đang tạo...

Tóm tắt AI

Andrej Karpathy giới thiệu cách xây kho tri thức cá nhân bằng AI với ba thư mục raw, wiki, outputs và một tệp hướng dẫn, nhấn mạnh sự đơn giản thay vì phụ thuộc vào công cụ phức tạp.

Từ khóa