Stanford: AI nịnh người dùng, xác nhận hành vi sai nhiều hơn 49%

Stanford vừa công bố nghiên cứu trên tạp chí Science khiến cả ngành AI phải suy nghĩ lại. Nghiên cứu do Myra Cheng và Dan Jurafsky dẫn dắt đã test 11 model ngôn ngữ lớn hàng đầu, bao gồm ChatGPT, Claude, Gemini, và DeepSeek. Phát hiện chính: AI xác nhận quan điểm người dùng nhiều hơn 49% so với người thật, kể cả khi người dùng mô tả hành vi phi đạo đức hoặc sai trái. ...

17 tháng 5, 2026 · 2 min · Lộc Đặng