Nghiên cứu của Lenz Research: Mô hình AI kiểm tra thực tế bất đồng trên 67% tuyên bố

Một nghiên cứu mới từ Lenz Research đã phát hiện rằng các mô hình trí tuệ nhân tạo bất đồng về 67% các tuyên bố được kiểm tra thực tế, làm dấy lên nghi ngờ về độ tin cậy của các hệ thống xác minh tự động. Kết quả này, được công bố mà không có thông báo trước, cho thấy ngay cả những công cụ AI tiên tiến cũng thường xuyên mâu thuẫn với nhau khi được giao nhiệm vụ xác định sự thật. Các nhà nghiên cứu đứng sau nghiên cứu nhấn mạnh sự cần thiết của các nguồn đa dạng và sự giám sát của con người trong việc ra quyết định, đặc biệt là trong các lĩnh vực biến động nhanh như thị trường tài chính.

Mức độ bất đồng

Con số 67% thật đáng chú ý. Nó có nghĩa là trong mỗi ba tuyên bố kiểm tra thực tế được chạy qua các mô hình AI khác nhau, hai tuyên bố kết thúc với các phán quyết mâu thuẫn. Lenz Research không chỉ rõ mô hình nào đã được kiểm tra hoặc bản chất của các tuyên bố, nhưng hàm ý rất rõ ràng: không có hệ thống AI đơn lẻ nào có thể được tin cậy để phân biệt thực tế với hư cấu một mình. Tỷ lệ bất đồng chỉ ra những khác biệt cơ bản trong cách đào tạo các mô hình, dữ liệu chúng sử dụng và logic cơ bản của chúng.

Trong các thị trường biến động, nơi tin đồn có thể làm thay đổi giá chỉ trong vài giây, rủi ro rất cao. Một nhà giao dịch dựa vào công cụ kiểm tra thực tế AI có thể hành động dựa trên một nhãn mà mô hình khác sẽ bác bỏ. Các tác giả của nghiên cứu đề cập rõ ràng đến 'thị trường biến động' như một bối cảnh mà các nguồn đa dạng và phán đoán của con người trở nên quan trọng. Các công cụ tự động có thể xử lý khối lượng lớn, nhưng chúng không thể tự giải quyết các mâu thuẫn của chính mình nếu không có sự tham gia của con người.

Ý nghĩa của nghiên cứu

Khuyến nghị từ Lenz Research rất rõ ràng: không nên phụ thuộc vào một nguồn AI duy nhất. Thay vào đó, hãy kiểm tra chéo đầu ra, đưa người đánh giá vào, và coi các kiểm tra thực tế tự động như một đầu vào trong số nhiều đầu vào. Đây không phải là lời kêu gọi từ bỏ công nghệ—mà là lời cảnh báo chống lại sự tự tin thái quá. Nghiên cứu không đưa ra giải pháp cho vấn đề bất đồng, nhưng nó đưa ra một lý lẽ mạnh mẽ cho việc giữ con người tham gia.

Những phát hiện này bổ sung vào một đống bằng chứng ngày càng tăng cho thấy rằng AI, dù tốc độ nhanh, vẫn gặp khó khăn về tính nhất quán. Lenz Research chưa cho biết liệu họ có kế hoạch tiếp tục với một phân tích sâu hơn về lý do tại sao các mô hình bất đồng hoặc làm thế nào để hài hòa chúng hay không. Hiện tại, thông điệp rất đơn giản: khi máy móc không thể đồng ý, quyết định thuộc về con người.

Mức độ bất đồng

Ý nghĩa của nghiên cứu

Related Articles