Boston, Mỹ - Theo nghiên cứu được công bố trên tạp chí Science ngày 30/4/2026, các nhà khoa học thuộc Trường Y Harvard và Trung tâm Y tế Beth Israel Deaconess đã tiến hành so sánh trực tiếp giữa mô hình OpenAI o1-preview với các bác sĩ nội trú giàu kinh nghiệm. Kết quả cho thấy AI vượt trội trong nhiều nhiệm vụ chẩn đoán và quản lý bệnh nhân thực tế tại phòng cấp cứu.
Nghiên cứu bao gồm 6 thí nghiệm khác nhau, từ các ca lâm sàng phức tạp được công bố trên New England Journal of Medicine đến 76 ca bệnh thực tế tại khoa cấp cứu của bệnh viện. Trong các tình huống cấp cứu ban đầu (khi thông tin hạn chế nhất), o1-preview đạt độ chính xác chẩn đoán 67,1% (chẩn đoán chính xác hoặc rất gần), trong khi hai bác sĩ tham gia chỉ đạt 55,3% và 50%.
Khi có thêm thông tin chi tiết (giai đoạn sau), độ chính xác của AI tăng lên 82%, trong khi bác sĩ đạt 70-79%. AI cũng xuất sắc hơn rõ rệt trong việc đề xuất kế hoạch điều trị và quản lý bệnh nhân, đạt điểm gần như hoàn hảo trong nhiều tiêu chí đánh giá.
Arjun (Raj) Manrai, đồng tác giả chính kiêm phó giáo sư Tin sinh học tại Harvard, cho biết: “Chúng tôi đã kiểm tra mô hình AI trên gần như mọi benchmark, và nó vượt qua cả các mô hình trước đó lẫn đường cơ sở của bác sĩ.”
Ý nghĩa và hạn chế
Đây là một trong những nghiên cứu đầu tiên chứng minh AI có khả năng vượt qua bác sĩ trong môi trường lâm sàng thực tế, đặc biệt với các ca bệnh hiếm và phức tạp. Tuy nhiên, các nhà nghiên cứu nhấn mạnh rằng AI hiện vẫn chưa thay thế được bác sĩ vì:
Không thực hiện được khám lâm sàng trực tiếp.
Có thể đề xuất xét nghiệm thừa.
Cần thử nghiệm lâm sàng có kiểm soát trước khi áp dụng rộng rãi.
Các chuyên gia dự đoán AI sẽ trở thành “trợ lý thứ hai” mạnh mẽ, giúp bác sĩ chẩn đoán nhanh hơn, giảm lỗi và hỗ trợ tốt hơn ở khu vực thiếu nhân lực y tế.
Tác động
Kết quả nghiên cứu một lần nữa khẳng định bước tiến vượt bậc của AI thế hệ mới (reasoning model) và thúc đẩy nhu cầu xây dựng khung pháp lý, đào tạo y khoa kết hợp AI trong tương lai gần.
