Ứng dụng nhận dạng các cây thuốc quý

Các nhà khoa học Trường Đại học Yersin Đà Lạt (Lâm Đồng) đã phát triển thành công ứng dụng nhận dạng cây thuốc quý...

Nhận diện các loài dược liệu bằng phần mềm giúp tăng cao độ chính xác.

Nhận diện các loài dược liệu bằng phần mềm giúp tăng cao độ chính xác.

Ứng dụng giúp nhanh chóng xác định loài, tránh nhầm lẫn giữa những cây có hình thái gần giống nhau.

Phân loại nguồn dược liệu phong phú

“Nhận dạng một số loài cây thuốc bằng mô hình Convolutional neural network (CNN) trên ứng dụng di động” là nghiên cứu của TS Nguyễn Đức Tấn và Thái Thuận Thương, Khoa Công nghệ Thông tin, Trường Đại học Yersin Đà Lạt.

Theo TS Nguyễn Đức Tấn, Việt Nam là quốc gia nhiệt đới có sự đa dạng về khí hậu và địa hình, phù hợp cho sinh trưởng nhiều loài dược liệu quý. Việt Nam sở hữu một hệ thống y học cổ truyền từ lâu đời với các loại cây thuốc và thảo dược đã đóng góp lớn vào công tác phòng, chữa bệnh tại địa phương.

Dựa trên kinh nghiệm truyền lại, người dân ở vùng nông thôn, miền núi từ xa xưa đã phân biệt cây thuốc dựa vào đặc điểm về mùi vị, lá, thân, rễ và hoa. Các loại cây thuốc có sẵn tại địa phương này đã được sử dụng để điều trị một số bệnh nói chung, ngoài ra, một số loại còn được sử dụng như rau và gia vị hằng ngày để bảo vệ sức khỏe, cung cấp dinh dưỡng.

Theo công bố của các nhà nghiên cứu, Việt Nam có hơn 5.100 loại cây thuốc và dược liệu, bên cạnh các loại dược liệu phổ biến còn có một số loại rất quý hiếm, có giá trị. Việc xác định chính xác các cây thuốc dược liệu là rất quan trọng để xác định các đặc tính dược liệu và ứng dụng chữa bệnh tiềm năng.

Một vấn đề tồn tại đối với số lượng dược liệu vô cùng phong phú như vậy là khó khăn trong việc nhận biết một cách chính xác cây thuốc dựa trên các đặc điểm hình thái của chúng, do có tính tương đồng. Việc nhận biết bằng mắt thường sẽ tốn nhiều thời gian, công sức, đòi hỏi kiến thức và kinh nghiệm của người dùng.

Nhóm nghiên cứu đã ứng dụng công nghệ học sâu (Deep learing) để xây dựng giải pháp nhận dạng cây thuốc trên ứng dụng thiết bị di động tích hợp mô hình mạng nơron tích chập hiện đại EfficientB0.

Nhóm kết hợp với phương pháp tăng cường dữ liệu để tăng hiệu suất nhận dạng. Mô hình MobileNetV2 cũng được sử dụng để so sánh kết quả dựa trên bộ dữ liệu hình ảnh của 41 loại dược liệu ở Việt Nam được thu thập từ các nguồn từ Internet, cơ sở dữ liệu quốc gia và thực tiễn.

Huấn luyện mô hình nhận diện

Theo TS Nguyễn Đức Tấn, thu thập hình ảnh dược liệu cây thuốc và thảo dược để huấn luyện mô hình là khâu quan trọng nhất quyết định đến độ chính xác của mô hình CNN. Nhóm đã thu thập hình ảnh của 41 loại cây thuốc và thảo dược phổ biến, việc thu thập hình ảnh, gắn nhãn loại dược liệu dựa trên các thông tin mô tả chi tiết về tên khoa học, tên dân gian, họ cây thuốc kèm hình vẽ mô tả hình thái tự nhiên của lá hoặc hoa, được đặc tả chi tiết.

Người dùng có thể tìm kiếm theo từ khóa hoặc hình ảnh. Như các chức năng tìm kiếm thông thường, người dùng có thể nhập tên (một phần tên) của cây thuốc quan tâm hoặc một từ khóa bất kỳ ở dạng tiếng Việt có dấu và không dấu, hệ thống sẽ tìm kiếm các cây thuốc có chứa thông tin tương ứng trong cơ sở dữ liệu.

Hệ thống có khả năng tìm kiếm tự động một cây thuốc dựa trên việc nhận dạng ảnh lá cây tương ứng; tìm kiếm dựa trên mô tả các đặc trưng sinh học có tương tác với người sử dụng.

Hệ thống hỗ trợ việc tìm kiếm dựa trên ảnh chụp lá cây ngay trên thực địa, hay môi trường ngoài trời. Khả năng tìm kiếm dựa trên hình ảnh là một trong những ưu điểm nổi trội của hệ thống so với những phương pháp tìm kiếm truyền thống sử dụng từ khóa.

Nếu thiết bị di động có khả năng xử lý tốt và có dung lượng lưu trữ đủ lớn thì EfficientNetB0 là một lựa chọn tốt để đảm bảo độ chính xác mô hình. Ngược lại, nếu thiết bị bị giới hạn về tài nguyên, khả năng tính toán của vi xử lý thì MobileNetV2 là lựa chọn để cân bằng về tốc độ và dung lượng, phù hợp để triển khai trên thiết bị di động bảo đảm tốt về hiệu suất nhưng vẫn duy trì tốc độ xử lý cũng như mức tiêu thụ tài nguyên hợp lý.

Nhóm thẳng thắn thừa nhận nghiên cứu có một số hạn chế như dữ liệu hình ảnh hạn chế do khó khăn trong việc thu thập một số loại thuốc ít gặp, làm giảm khả năng mô hình nhận diện được biến thể của một số cây thuốc trong thực tế.

Thời gian tới nhóm sẽ mở rộng tập dữ liệu đặc biệt đối với một số loại cây thuốc đã có tuy nhiên tỷ lệ dự đoán đúng thấp; cải tiến tối ưu hóa mô hình bằng cách áp dụng thêm các kiến trúc tối ưu hơn hoặc thuật toán phân loại để cải thiện tốc độ và tiết kiệm tài nguyên mà vẫn duy trì độ chính xác cao; cải thiện khả năng xử lý hình ảnh thực tế trong các môi trường không kiểm soát như ánh sáng yếu, nhiễu động và hình ảnh chất lượng thấp bằng các kỹ thuật xử lý ảnh nâng cao…

Nhật Phong

Nguồn GD&TĐ: https://giaoducthoidai.vn/ung-dung-nhan-dang-cac-cay-thuoc-quy-post729890.html