Phiên bản mới nhất của ChatGPT đậu kỳ thi cấp phép hành nghề y ở Mỹ
GPT-4 xuất sắc vượt qua kỳ thi cấp phép y tế của Mỹ, có thể chẩn đoán bệnh và sở hữu khả năng dịch thuật tốt đến mức nhiều nhà khoa học bất ngờ.
Tiến sĩ Isaac Kohane, nhà khoa học máy tính tại Đại học Harvard, đồng thời là bác sĩ, đã hợp tác với hai đồng nghiệp để thử nghiệm GPT-4. Mục đích của ông là kiểm tra thử mô hình trí tuệ nhân tạo mới nhất của OpenAI sẽ hoạt động như thế nào trong môi trường y tế, theo Insider.
GPT-4 giỏi hơn một số bác sĩ hành nghề
Trong cuốn sách The AI Revolution in Medicine sắp xuất bản, tiến sĩ Kohane nói rằng ông rất bất ngờ khi thấy GPT-4 giỏi hơn nhiều bác sĩ ông từng đánh giá.
GPT-4 mới được phát hành vào tháng 3, người dùng phải trả phí mới được sử dụng. Tiến sĩ Kohane thông tin sản phẩm mới của OpenAi có thể trả lời chính xác hơn 90% câu hỏi trong kỳ thi cấp phép hành nghề y của Mỹ. So với các phiên bản của ChatGPT trước đây như GPT-3 và GPT-3,5, GPT-4 thể hiện tốt hơn nhiều, thậm chí giỏi hơn một số bác sĩ đã được cấp phép hành nghề.
Các nhà nghiên cứu nói thêm GPT-4 không chỉ là công cụ tìm kiếm thông tin hay là một "thí sinh" giỏi, nó còn là một dịch giả tài năng.
Trong cuốn The AI Revolution in Medicine, ông Kohane và các cộng sự cho biết GPT-4 có khả năng dịch thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha, đồng thời dịch những ngôn ngữ kỹ thuật phức tạp thành những thông tin mà học sinh lớp 6 có thể dễ dàng đọc hiểu.
Ngoài ra, sản phẩm của OpenAi có thể cung cấp cho bác sĩ những gợi ý hữu ích về cách chăm sóc, nói chuyện với bệnh nhân, đồng thời đọc các báo cáo và nghiên cứu dài, sau đó tóm tắt lại chỉ trong chớp mắt.
Thậm chí, GPT-4 còn có thể giải thích nguyên nhân của các vấn đề thông qua các phương pháp đòi hỏi kỹ thuật đo đạc tính toán giống như cách con người thường làm.
GPT-4 vẫn mắc lỗi
Nếu bạn thắc mắc vì sao GPT-4 có thể làm được những điều này, câu trả lời sẽ là tất cả trí thông minh của nó vẫn bị giới hạn trong các mẫu dữ liệu và không liên quan đến sự hiểu biết hay chủ đích tìm hiểu của nó.
Dù còn nhiều hạn chế, GPT-4 vẫn có thể bắt chước cách bác sĩ chẩn đoán bệnh, dù việc chẩn đoán không phải lúc nào cũng hoàn hảo.
Để kiểm tra khả năng chẩn đoán bệnh của GPT-4, tiến sĩ Kohane đã sử dụng một trường hợp thực tế liên quan một em bé sơ sinh ông từng điều trị vài năm trước.
Theo đó, ông cung cấp cho GPT-4 một số chi tiết về em bé cũng như một số thông tin siêu âm và nồng độ hormone. Kết quả, công cụ của OpenAi có thể chẩn đoán chính xác tình trạng của trẻ là tăng sản tuyến thượng thận bẩm sinh (CAH).
Tiến sĩ Kohane vừa ngạc nhiên vừa kinh hãi trước khả năng chẩn đoán bệnh của GPT-4 vì nó có thể đạt được điều mà ông phải mất nhiều năm học tập và làm việc mới có thể làm được.
Tuy nhiên, GPT-4 không phải lúc nào cũng đúng và đáng tin cậy. Chúng vẫn còn mắc những lỗi cơ bản như viết sai chỉ số BMI, giải sai câu đố Sudoku hoặc giải phương trình sai. Việc tính toán sai có thể khiến công cụ này gặp những sai sót nghiêm trọng khi kê đơn hoặc chẩn đoán bệnh.
Giống như các phiên bản trước, GPT-4 cũng có thể gặp "ảo giác". Đây là cách nói ví von khi chúng đưa ra câu trả lời sai hoặc không tuân theo yêu cầu của người dùng.
Khi nhóm nghiên cứu hỏi về vấn đề này, GPT-4 nói rằng nó không có ý định nói dối hay đánh lừa ai, đôi khi nó mắc sai lầm hoặc đưa ra những giả định dựa trên dữ liệu không đầy đủ hoặc thiếu chính xác.
"Tôi không có khả năng chẩn đoán lâm sàng hay trách nhiệm đạo đức giống bác sĩ hoặc y tá", GPT-4 nói.
Nhóm nghiên cứu nhấn mạnh rằng GPT-4 có thể giúp tiết kiệm thời gian và nguồn lực trong phòng khám, cho phép các bác sĩ gặp gỡ bệnh nhân nhiều hơn thay vì cả ngày chỉ nhìn vào màn hình máy tính. Tuy nhiên, chúng ta vẫn cần nghĩ đến việc nếu sau này các cỗ máy ngày càng thông minh hơn, chúng có thể sẽ vượt mặt con người ở mọi khía cạnh trong cuộc sống.