Bệnh viện Trung Quốc lấy hồ sơ bệnh án làm dữ liệu nuôi AI

Các bệnh viện Trung Quốc đang tích cực thương mại hóa kho lưu trữ hồ sơ bệnh án khổng lồ của mình thành một loại hàng hóa vô cùng sinh lời.

Các bệnh viện Trung Quốc muốn cung cấp nguồn nguyên liệu thiết yếu cho ngành công nghiệp trí tuệ nhân tạo đang bùng nổ mạnh mẽ tại quốc gia này. Sự chuyển dịch từ việc cất giữ thụ động sang khai thác chủ động đang tạo ra một nền kinh tế dữ liệu y tế hoàn toàn mới, thu hút sự chú ý của giới công nghệ và y khoa toàn cầu.

Bệnh viện Trung Quốc biến hồ sơ bệnh án ngủ yên thành mỏ vàng kỹ thuật số

Gần đây, Bệnh viện trực thuộc thứ nhất của Đại học Y khoa số 1 Sơn Đông đã hoàn tất thương vụ bán một tập dữ liệu chứa các thông tin lâm sàng về bệnh gan và tình trạng cấy ghép cho công ty công nghệ Sơn Đông Shanke Zhixin với mức giá 30 nghìn nhân dân tệ, tương đương khoảng 4399 USD. Giao dịch này đánh dấu cột mốc quan trọng khi trở thành thương vụ mua bán dữ liệu y tế đầu tiên tại tỉnh Sơn Đông ở phía đông đất nước. Tập dữ liệu này bao gồm hơn 1000 hồ sơ bệnh án đã được ẩn danh của những bệnh nhân bị suy gan cần đánh giá để ghép tạng. Với tư cách là bên mua, công ty công nghệ dự kiến sử dụng khối tài sản kỹ thuật số này để phát triển một mô hình chẩn đoán bệnh gan có sự hỗ trợ của trí tuệ nhân tạo.

Hồ sơ bệnh án rất cần thiết cho AI

Hồ sơ bệnh án rất cần thiết cho AI

Trong kỷ nguyên của trí tuệ nhân tạo y tế, khối lượng khổng lồ dữ liệu sức khỏe thực tế được tạo ra bên trong các bệnh viện đã trở thành nguồn nhiên liệu thiết yếu cho quá trình đào tạo mô hình và phát triển các tác nhân thông minh. Các hệ thống học máy cần tiêu thụ hàng triệu điểm dữ liệu để có thể nhận diện chính xác các mô hình bệnh lý phức tạp. Các chuyên gia trong ngành nhìn nhận những thông tin độc quyền này như một nguồn tài nguyên thậm chí còn khan hiếm hơn cả thuật toán hay sức mạnh tính toán máy chủ.

Từ hồ sơ bệnh nhân, kết quả xét nghiệm cho đến hình ảnh y khoa như chụp cắt lớp vi tính và cộng hưởng từ, cùng với sự tích lũy ngày càng tăng của các nghiên cứu lâm sàng, những tập dữ liệu nguyên thủy này trong lịch sử thường bị bỏ không sau khi quá trình điều trị của bệnh nhân kết thúc. Chúng bị khóa chặt trong các máy chủ cục bộ hoặc lưu trữ vật lý mà không tạo ra thêm bất kỳ giá trị gia tăng nào. Giờ đây, chúng đang được khai thác như một mỏ vàng kỹ thuật số đích thực, mở ra những hướng đi mới trong việc nâng cao độ chính xác của y học chẩn đoán và cá nhân hóa phác đồ điều trị cho từng cá nhân.

Lực đẩy từ chính sách và sự bùng nổ của các sàn giao dịch

Sự đổ xô đột ngột vào thị trường này là một phần trong chỉ thị rộng lớn hơn của chính phủ nhằm thương mại hóa các tài sản kỹ thuật số, biến dữ liệu thành một yếu tố sản xuất then chốt. Vào năm 2024, Cục Dữ liệu Quốc gia cùng 16 bộ ngành khác đã ban hành một kế hoạch hành động kéo dài ba năm nhằm giải phóng giá trị kinh tế của dữ liệu trên 12 lĩnh vực, trong đó nhắm mục tiêu rõ ràng vào chăm sóc sức khỏe.

Bắc Kinh đã ghi nhận giao dịch đầu tiên liên quan đến dữ liệu của một bệnh viện công vào cuối năm đó. Bệnh viện Tuyên Vũ thuộc Đại học Y khoa Thủ đô đã bán một tập dữ liệu gồm 2550 hồ sơ liên quan đến thủ thuật đặt stent động mạch cảnh trên Sàn giao dịch Dữ liệu lớn Quốc tế Bắc Kinh, tạo điều kiện thuận lợi cho việc nghiên cứu và phát triển các thiết bị y tế sản xuất trong nước, giảm sự phụ thuộc vào công nghệ nước ngoài.

Lực đẩy từ chính sách tiếp tục thúc đẩy các đợt niêm yết trên thị trường một cách mạnh mẽ. Vào ngày 24/3, Giám đốc Cục Dữ liệu Quốc gia Lưu Liệt Hoành đã phát biểu tại một cuộc họp báo rằng chính phủ sẽ tiếp tục nuôi dưỡng sự đồng thuận của thị trường để trả tiền cho dữ liệu chất lượng cao. Ông Lưu cho biết cơ quan này sẽ gây áp lực buộc ngành phải niêm yết và giao dịch các tập dữ liệu hàng đầu trên các sàn giao dịch. Một số chính quyền địa phương thậm chí đang thiết lập các hạn ngạch vô cùng cứng rắn để thúc đẩy tiến độ. Vào tháng 1, thành phố Ôn Châu đã bắt buộc các cơ sở y tế phải niêm yết ít nhất 45 sản phẩm dữ liệu và hoàn thành 10 giao dịch trước cuối năm nay.

Các thỏa thuận đang nhân lên nhanh chóng trên khắp các tỉnh thành. Cũng trong tháng 1, Bệnh viện Đa khoa huyện Mân Thanh của tỉnh Phúc Kiến đã hoàn thành giao dịch cấp huyện đầu tiên trên sàn giao dịch Bắc Kinh, bán một cơ sở dữ liệu chuyên biệt bao gồm thần kinh học, tim mạch học và lão khoa trị giá hơn 450 nghìn nhân dân tệ. Các sàn giao dịch dữ liệu trên toàn quốc hiện đang tràn ngập các danh mục y tế.

Vào ngày 16/4, Công ty Thông tin Y tế Youjun Tây An đã đưa hơn 70 tập dữ liệu lên Sàn giao dịch Dữ liệu lớn Quý Dương. Nguồn dữ liệu này được thu thập từ các tình huống lâm sàng thực tế tại một bệnh viện ở Tây An, tập trung vào các bệnh ung thư có tỷ lệ mắc cao như ung thư phổi và ung thư gan. Trong khi đó, Sàn giao dịch Dữ liệu Quảng Châu đang lưu trữ các sản phẩm hình ảnh ung thư học từ Bệnh viện Ung bướu Cảnh Tây Bắc Kinh.

Trên bảng chăm sóc sức khỏe của Sàn giao dịch Dữ liệu Thâm Quyến, hai bệnh viện công lớn đã đưa tài nguyên của họ lên kệ bán. Bệnh viện Nhân dân Thâm Quyến đang cung cấp một tập dữ liệu lão khoa chất lượng cao kéo dài từ năm 2015 đến nay. Sản phẩm này bao gồm các thông tin nhân khẩu học đã ẩn danh, nhật ký thăm khám, hình ảnh và kết quả xét nghiệm. Các văn bản mô tả bao gồm lịch sử bệnh lý và kết luận chẩn đoán đã được phân tích cú pháp thành các trường thông tin có cấu trúc cao bằng trí tuệ nhân tạo.

Bệnh viện Chăm sóc Sức khỏe Bà mẹ và Trẻ em Thâm Quyến đã niêm yết hai sản phẩm. Sản phẩm thứ nhất bao gồm hình ảnh siêu âm trước sinh tiêu chuẩn và các bản phác thảo tương ứng được rút ra từ hàng trăm nghìn phụ nữ mang thai được sàng lọc trong khoảng thời gian từ năm 2010 đến năm 2012. Sản phẩm thứ hai là một tập dữ liệu thứ cấp ẩn danh gồm các hồ sơ lâm sàng từ những bệnh nhân được chẩn đoán mắc bệnh tăng huyết áp do thai kỳ từ năm 2018 đến năm 2023.

Nghịch lý thị trường và rào cản từ dữ liệu thô

Những tập dữ liệu quý giá này chủ yếu đang được thu mua bởi các công ty trí tuệ nhân tạo, các nhà sản xuất thiết bị y tế và dược phẩm sáng tạo, cùng các viện nghiên cứu học thuật. Ứng dụng của chúng trải dài từ việc đào tạo các mô hình chẩn đoán tự động cho đến khám phá các loại thuốc mới, rút ngắn đáng kể chu kỳ nghiên cứu sinh học.

Tuy nhiên, việc phi định danh nghiêm ngặt là điều bắt buộc trước khi bất kỳ hồ sơ nào được tung ra thị trường. Các chuyên gia trong ngành lưu ý rằng không có bất kỳ thông tin nào được giao dịch có thể được liên kết trở lại với một cá nhân cụ thể, đảm bảo rằng người mua hoàn toàn không thể truy cập vào các chi tiết cá nhân nhạy cảm như tên tuổi, địa chỉ hay thông tin liên lạc. Quyền riêng tư của bệnh nhân luôn được đặt lên hàng đầu trong mọi giao dịch thương mại.

Dù vậy, việc ẩn danh hóa mới chỉ là rào cản đầu tiên trên con đường thương mại hóa. Giá trị thương mại cuối cùng phụ thuộc hoàn toàn vào độ sạch và tính nhất quán của dữ liệu. Các chuyên gia cảnh báo rằng hồ sơ lịch sử của một bệnh viện thường rất lộn xộn và không thể sử dụng được nếu không có sự quản trị dữ liệu cực kỳ nghiêm ngặt. Bác sĩ thường có thói quen ghi chép khác nhau, sử dụng các từ viết tắt chuyên ngành không đồng nhất, dẫn đến các trường văn bản phi cấu trúc rất khó phân tích. Quá trình xử lý liên quan đến việc làm sạch, chuẩn hóa và chú thích thông tin một cách tỉ mỉ, một bước bắt buộc trước khi thông tin có thể được đưa vào hệ thống máy chủ để đào tạo các mô hình ngôn ngữ lớn.

Điều này tạo ra một nghịch lý thị trường rất lớn cản trở sự bứt phá của ngành. Các cơ sở y tế phải đối mặt với chi phí thời gian và tài chính đắt đỏ để huy động nhân sự dọn dẹp và phân loại dữ liệu của họ đến một tiêu chuẩn có thể chấp nhận được. Thế nhưng, nếu họ không làm vậy, các công ty công nghệ lại thấy rất ít giá trị trong các tệp thô chưa được tinh chế, từ đó làm đình trệ các giao dịch mua bán tiềm năng. Các hãng công nghệ không muốn mua về một mớ bòng bong tốn kém chi phí xử lý nội bộ.

Một người trong ngành đã ví von tình trạng ách tắc này bằng một hình ảnh rất thực tế: "Giống như việc xây một loạt các căn hộ xây dở dang". Người này cũng tiếp tục đặt ra một sự hoài nghi sâu sắc về tính khả thi của các giao dịch trên thị trường khi sản phẩm chưa đạt chuẩn: "Làm sao bạn có thể bán chúng". Sự bế tắc này đòi hỏi phải có những cơ chế phối hợp mới, nơi các rủi ro và chi phí xử lý được chia sẻ hợp lý giữa cơ sở y tế và doanh nghiệp, từ đó khơi thông dòng chảy của nguồn tài nguyên quý giá này và thúc đẩy sự bứt phá của toàn ngành y tế kỹ thuật số trong tương lai.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/benh-vien-trung-quoc-lay-ho-so-benh-an-lam-du-lieu-nuoi-ai-250710.html