AI Hallucination: Ảo giác AI là gì và những điểm cần chú ý

Hello cả nhà!
Tuần vừa qua mình có dịp tìm hiểu về khái niệm AI Hallucination – ảo giác AI, là một hiện tượng khá thú vị mà nhiều người dùng các dịch vụ AI, trong đó có cả bản thân mình, đã từng gặp phải. Trong bài blog này, mình sẽ giới thiệu những kiến thức cơ bản về AI Hallucination, nguyên nhân dẫn đến hiện tượng này, cũng như một số cách giúp hạn chế và giảm thiểu rủi ro khi sử dụng AI trong học tập và công việc. Hy vọng những thông tin này sẽ có ích với mọi người!

  • AI Hallucination là gì?
    Khi nghe đến từ “hallucination”, chúng ta thường sẽ liên tưởng tới các ảo giác được tạo ra bởi não bộ con người. Tuy nhiên, trong trường hợp AI, thì từ “ảo giác” này không dùng để chỉ cảm giác, mà là những trường hợp mà AI trả lời không chính xác một cách rất tự tin mà không dựa vào các số liệu thật. Nói cách khác, AI không thực sự “biết” thông tin đó là sai, mà đang dự đoán câu trả lời dựa trên các mẫu dữ liệu đã học, dẫn đến việc tạo ra những nội dung nghe có vẻ hợp lý nhưng thực tế không đúng.
  • Một số các trường hợp ảo giác phổ biến
    • Fabrication: Tự tạo ra câu trả lời hoàn toàn không có thật. Ví dụ tiêu biểu cho trường hợp này là khi vào năm 2023, các luật sư thuộc hãng luật Levidow, Levidow & Oberman P.C đã nộp các bằng chứng được tạo bởi ChatGPT trước bồi thẩm đoàn mà không kiểm chứng, và AI đã “ảo giác”, liệt kê ra các án lệ hoàn toàn không có thật. Các luật sư này đã chịu phạt tương ứng, nhưng ví dụ này cho chúng ta thấy sự nguy hiểm của AI Hallucination và khi con người không kiểm tra lại tính xác thực của các câu trả lời từ AI.
    • Distortion: Thông tin và khái niệm đều có thực, nhưng liên kết giữa chúng bị sai. Nghĩa là, các khái niệm và thực thể này bản chất là đúng khi chúng tồn tại độc lập, tuy nhiên, AI lại nhầm lẫn khi ghép chúng vào với nhau. Ví dụ, người A đã làm sự việc A và người B đã làm sự việc B, đây đều là các thông tin đúng nhưng có phần tương đồng. AI có thể sẽ đưa ra câu trả lời nhầm rằng người A đã làm sự việc B. Hoặc ví dụ như, một sự kiện đúng khi áp dụng trong năm 2020, nhưng năm 2026 đã không còn đúng nữa.
      ※Gần đây, với sự phát triển của các model mới, việc ảo giác của AI đã giảm đi rất nhiều. Mình đã nghiên cứu một số model AI trong quá trình viết bài blog này, nhưng các prompt bằng tiếng Anh của mình hầu như không làm AI nhầm được. Sau khi đổi lại prompt bằng tiếng Việt thì có vẻ mình đã “lừa” được AI một chút. Điều này có thể là do các model AI không được huấn luyện nhiều bằng dữ liệu tiếng Việt như tiếng Anh nên vẫn tồn tại một số khoảng trống mà AI không nắm được và phải tự điền vào (ảnh dưới là một ví dụ mà mình đã thành công “lừa” Claude nhầm lẫn giữa truyền thuyết Hồ Hoàn Kiếm và truyền thuyết Hồ Tây)
  • Vì sao AI lại hallucinate?
    Khi nhận được những câu trả lời có phần đáng ngờ từ AI, chắc các bạn cũng tự hỏi: vì sao AI lại có thể nhầm lẫn như vậy? Thực tế thì, AI hầu như đều là mô hình Large Language Model (LLM), chứ không phải là Thinking Model. Điều này có nghĩa là, AI được thiết kế để có thể thu thập được lượng dữ liệu cực kỳ lớn, và đưa ra câu trả lời phù hợp nhất dựa trên những dữ liệu sẵn có. Nói cách khác, AI chỉ đang dự đoán câu trả lời đúng dựa trên lượng tài liệu và tri thức khổng lồ mà nó đã được học thôi, chứ không có bước suy nghĩ và lập luận logic như con người. Điều này cũng đồng nghĩa với việc, nếu các nguồn dữ liệu không chính xác hoặc không đầy đủ, AI sẽ tìm cách để điền vào chỗ trống một cách hợp lý nhất thay vì trả lời “tôi không biết” hoặc “tôi không chắc”. Bạn có thể hình dung AI là một nghiên cứu sinh đọc và nhớ rất nhiều tài liệu, nhưng thực tế thì lại chưa bao giờ thực tế đi kiểm chứng các kiến thức đó. Nếu trong các cuốn sách mà học sinh này đọc đều miêu tả mặt trời mọc ở hướng tây, thì anh ta cũng chỉ có thể trả lời đúng như vậy, vì anh ta thực tế chưa bao giờ nhìn thấy mặt trời.
    Điều này không phải là lỗi hệ thống, mà là tính năng của AI. Các câu trả lời lưu loát và chi tiết thường được lựa chọn nhiều hơn các câu như “tôi không chắc” hay “tôi không biết”, nên AI có xu hướng trả lời rất chi tiết và tự tin, mặc dù những kiến thức đưa ra là sai.
  • Làm thế nào để giảm thiểu AI Hallucination?
    Các nhà phát triển cũng đã nhận ra vấn đề này và đang đưa ra các bản cập nhật để hạn chế tình trạng ảo giác, tuy nhiên, chúng ta không thể loại bỏ được nó hoàn toàn. Các biện pháp như tích hợp Retrieval-Augmented Generation (thu thập thông tin trên các website tại thời điểm hỏi, hiển thị “Searching the Web” trước khi trả lời) giúp AI có được câu trả lời dựa trên thông tin mới nhất, tránh tình trạng thông tin bị cắt tại thời điểm học với độ chính xác không cao. Ngoài ra, các câu trả lời như “tôi không biết” hoặc “tôi không có đủ thông tin”hay “hãy cho tôi thêm thông tin” được đánh điểm cao hơn, khuyến khích AI đưa ra các câu trả lời này khi không có đủ dữ liệu cần thiết.
  • Về phía người dùng, chúng ta có thể thực hiện một số bước sau để giảm thiểu việc ảo giác của AI.
    • Đưa ra các prompt cụ thể và chính xác:
      Thay vì hỏi các câu hỏi có phạm vi không được định nghĩa rõ ràng, bằng cách hạn chế và chỉ đích danh nguồn dữ liệu, chúng ta sẽ có được những câu trả lời chính xác hơn. Ví dụ như thay vì hỏi chung chung “Người lao động ở Việt Nam có được đối xử tốt không?”, chúng ta có thể hỏi “Quyền lợi của người lao động ở Việt Nam theo luật hiện hành như thế nào?”. Câu hỏi này sẽ giới hạn nguồn tham chiếu của AI xuống các văn bản pháp luật hiện hành tại Việt Nam và cho chúng ta câu trả lời súc tích, cụ thể về các quyền lợi theo luật mới nhất.
    • Yêu cầu AI trả lời “không biết”
      Khi đưa ra yêu cầu cho AI, bạn có thể thêm điều kiện “Đừng đưa ra câu trả lời khi bạn không chắc chắn, hãy yêu cầu tôi cung cấp thêm thông tin mà bạn còn thiếu. Hãy trả lời “tôi không chắc chắn” nếu dữ liệu của bạn không toàn vẹn” vào prompt để giảm tỉ lệ hallucination. Với Claude và ChatGPT, bạn có thể định hướng phong cách này cho model tại mục custom instructions để áp dụng cho tất cả các đoạn chat. Gemini thì chưa có tính năng này, nên bạn sẽ phải thêm điều kiện này một cách thủ công mỗi lần bắt đầu một cửa sổ chat mới.
    • Yêu cầu AI thêm bước “thought process” (liệt kê các bước để đưa ra câu trả lời)
      Bằng cách yêu cầu AI thêm từng bước để dẫn tới câu trả lời, chúng ta có thể dễ dàng nhìn thấy các điểm phi logic dẫn tới câu trả lời cuối cùng sai. Một số model như DeepSeek cho phép người dùng lựa chọn “Think” mode, và các bước dẫn tới câu trả lời cuối cùng sẽ hiển thị rõ ràng. Với các model khác, bạn có thể thêm từ khóa “step by step” vào mỗi câu prompt của mình để đảm bảo rằng AI cho câu trả lời theo từng bước và chúng ta có thể tự mình kiểm tra lại mỗi bước đó.
    • Yêu cầu AI thêm dẫn chứng cụ thể (citation)
      Một cách khác để tăng độ chính xác từ câu trả lời của AI, đó là yêu cầu AI thêm các dẫn chứng cụ thể vào mỗi câu trả lời. Dẫn chứng này có thể nằm dưới dạng đường dẫn, mà bằng cách nhấp vào chúng, chúng ta có thể kiểm chứng xem nguồn này có thật không, có đáng tin không, và dựa vào đó đưa được ra phán đoán rằng AI đang trả lời đúng hay là đang ảo giác. Mọi người có thể thêm từ khóa “thêm link dẫn chứng” hoặc “with url citation” vào mỗi prompt, hoặc thêm yêu cầu này vào phần custom instructions để AI gắn kèm link vào mỗi câu trả lời.

AI là một công cụ hết sức hữu ích, chứa vô vàn thông tin và luôn sẵn sàng trả lời mọi câu hỏi của chúng ta. Để sử dụng AI một cách hiệu quả và để giảm thiểu hiện tượng hallucination, mọi người hãy thử áp dụng các mẹo trên nhé! Happy prompting! 😀

※Bonus: mọi người có thể theo dõi tỉ lệ Hallucination từ các model khác nhau tại đây https://huggingface.co/spaces/vectara/leaderboard

Add a Comment