Ứng dụng AI đa phương thức phát hiện tin giả trên mạng xã hội

Nghiên cứu mới khẳng định giải pháp AI đa phương thức mở ra bước tiến vượt trội trong việc kiểm soát, phát hiện tin giả và quản trị nội dung số.

3 giờ trướcGốc

Hệ thống phân tích dựa trên công nghệ AI đa phương thức vừa được các nhà khoa học thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam đề xuất thành công.

Trong kỷ nguyên số hóa phát triển mạnh mẽ ngày nay, các nền tảng mạng xã hội phổ biến như Facebook, TikTok, Instagram và YouTube đã nhanh chóng trở thành một phần không thể thiếu trong đời sống tinh thần cũng như giao tiếp xã hội hằng ngày của hàng tỉ người trên toàn thế giới. Sự chuyển dịch mang tính bước ngoặt này biến không gian mạng thành một kho tàng thông tin vô cùng khổng lồ, nơi dữ liệu số liên tục được sản sinh theo từng giây, từng phút dưới nhiều hình thái vô cùng phong phú và đa dạng.

Mỗi phút trôi qua, thế giới chứng kiến hàng triệu lượt bài đăng, hàng trăm nghìn giờ video được tải lên và vô số các dòng bình luận, tương tác. Tuy nhiên, sự bùng nổ này cũng đi kèm với một thách thức mang tính thời đại: sự lan tràn của các thông tin sai lệch, tin giả (fake news) với mức độ ngày càng tinh vi và tốc độ phát tán chóng mặt. Thực trạng này đặt ra yêu cầu cấp bách về một công cụ kiểm soát thông tin thông minh, hiệu quả và có khả năng vận hành tự động theo thời gian thực.

Việc phát tán tin giả ngày càng phổ biến hơn trong thời đại số. Ảnh minh họa

Trước đây, các hệ thống lọc thông tin truyền thống hoặc các mô hình trí tuệ nhân tạo thế hệ cũ thường chỉ tập trung vào việc xử lý đơn phương thức - tức là phân tích riêng lẻ từng loại dữ liệu như văn bản hoặc hình ảnh. Cách tiếp cận này bộc lộ những lỗ hổng rất lớn khi đối mặt với các thủ đoạn tạo tin giả hiện đại, nơi mà một văn bản hoàn toàn bình thường khi đặt cạnh một hình ảnh cắt ghép lại tạo ra một ngữ nghĩa sai lệch hoàn toàn. Sự phân mảnh ngữ nghĩa giữa các loại dữ liệu chính là rào cản kỹ thuật lớn nhất mà các công nghệ cũ chưa thể vượt qua.

Kiến trúc đột phá từ AI đa phương thức

Nhằm giải quyết triệt để bài toán phức tạp này, nhóm nghiên cứu gồm các chuyên gia hàng đầu từ Viện Công nghệ thông tin và Trung tâm Vũ trụ Việt Nam đã thiết kế một kiến trúc hệ thống phân tầng hoàn chỉnh, tận dụng sức mạnh của các mô hình học sâu tiên tiến nhất hiện nay. Hệ thống được cấu trúc một cách khoa học để có thể tiếp nhận, xử lý đồng thời và đồng bộ hóa các luồng dữ liệu thô từ nhiều nguồn khác nhau bao gồm văn bản tiếng Việt, hình ảnh trực quan, âm thanh và video.

Trọng tâm của kiến trúc mới này là sự kết hợp giữa mô hình ngôn ngữ lớn chuyên sâu cho tiếng Việt (PhoBERT) và mô hình thị giác máy tính hiện đại (Vision Transformer). Điểm cốt lõi tạo nên sự khác biệt vượt trội chính là cơ chế chú ý chéo (Cross-Attention). Thay vì phân tích độc lập, cơ chế này cho phép thành phần văn bản liên tục "truy vấn" và đối chiếu trực tiếp với các đặc trưng của hình ảnh hoặc video đi kèm. Điều này giúp hệ thống phát hiện ra những điểm mâu thuẫn tinh vi giữa nội dung chữ viết và bối cảnh trực quan - một trong những dấu hiệu điển hình nhất của các tin tức giả mạo trên mạng xã hội hiện nay.

Toàn bộ quy trình từ thu thập, xử lý dòng dữ liệu thông qua nền tảng Apache Kafka cho đến việc trích xuất vector đặc trưng đều được tối ưu hóa một cách nghiêm ngặt. Các vector sau khi trích xuất được lưu trữ trong cơ sở dữ liệu vector chuyên dụng Milvus, cho phép thực hiện các phép toán tìm kiếm tương đồng và đối sánh ngữ cảnh với tốc độ cực cao, đáp ứng hoàn hảo yêu cầu giám sát thông tin theo thời gian thực của các cơ quan quản lý nội dung số.

Khả năng ứng dụng thực tế và tối ưu hóa tài nguyên vận hành

Một trong những điểm cộng lớn của công trình nghiên cứu này là tính thực tiễn cao và khả năng triển khai trên quy mô lớn một cách bền vững. Nhóm tác giả đã tích hợp thành công quy trình MLOps (Machine Learning Operations), đảm bảo hệ thống luôn vận hành ổn định, có khả năng tự động cập nhật và liên tục học hỏi từ những mẫu tin tức, xu hướng ngôn ngữ mới trên không gian mạng mà không làm gián đoạn hệ thống.

Bên cạnh đó, nhận thức được thách thức về chi phí hạ tầng phần cứng khi xử lý các mô hình học sâu khổng lồ, các nhà khoa học Việt Nam đã áp dụng một giải pháp công nghệ thông minh mang tên "Chưng cất tri thức" (Knowledge Distillation). Kỹ thuật này cho phép chuyển giao năng lực phân tích từ các mô hình nén lớn, cồng kềnh sang các mô hình nhỏ gọn hơn nhưng vẫn duy trì được độ chính xác gần như tương đương. Nhờ vậy, hệ thống có thể vận hành mượt mà trên các cấu hình máy chủ thông thường, tiết kiệm tối đa chi phí đầu tư hạ tầng cho doanh nghiệp và các tổ chức quản lý.

Sự thành công của nghiên cứu này không chỉ mang lại một công cụ kỹ thuật mạnh mẽ giúp làm sạch môi trường mạng, bảo vệ người dùng trước các làn sóng thông tin độc hại, mà còn khẳng định năng lực làm chủ công nghệ cao của các nhà khoa học trong nước. Đây chắc chắn sẽ là nền tảng công nghệ then chốt, đóng góp quan trọng vào chiến lược chuyển đổi số quốc gia và xây dựng không gian mạng an toàn, văn minh tại Việt Nam trong tương lai gần.

Nam Phong

Nguồn Một Thế Giới: https://1thegioi.vn/ung-dung-ai-da-phuong-thuc-phat-hien-tin-gia-tren-mang-xa-hoi-251772.html

Thanh niên lập Facebook có tích xanh giả mạo sư thầy, lừa tiền công đức

2 phút

Cảnh giác mất tiền vì đặt phòng du lịch giá rẻ

2 giờ

Thông tin quan trọng dành cho 3 tỉ người dùng Google Chrome

3 giờ

Tin nóng

Mỹ điều tra nghi vấn tin tặc xâm nhập hệ thống giám sát nhiên liệu

3 giờ

Các quan chức Mỹ đang điều tra hàng loạt vụ tấn công mạng nhằm vào hệ thống giám sát lượng nhiên liệu trong bồn chứa tại nhiều trạm xăng trên khắp nước này, với nghi vấn hàng đầu hướng tới các nhóm tin tặc có liên hệ với Iran.

Vì sao ô tô Mỹ khó xóa bỏ linh kiện Trung Quốc?

3 giờ

Ford, GM và Toyota đều sử dụng linh kiện Trung Quốc trong bối cảnh các nhà lập pháp đang thúc đẩy các biện pháp hạn chế nghiêm ngặt hơn đối với Trung Quốc.

Điểm này sẽ khiến các hãng điện thoại Android mất khách về tay Apple

5 giờ

Chi phí cho chip Snapdragon thế hệ mới có thể có giá hơn 300 USD, đẩy điện thoại Android cao cấp lên mức giá chưa từng có và vô tình tạo lợi thế cho Apple.

Sony giới thiệu bộ đôi máy ảnh Alpha 7R VI và ống kính G Master 100-400mm F4.5

16 phút

Sony tung combo hơn 200 triệu đồng Alpha 7R VI và ống kính siêu tele G Master.

Giáo sư, Tiến sĩ Chu Văn Đạt - Người thầy với ngọn lửa đam mê khoa học

2 giờ

Trong hành trình 60 năm xây dựng và phát triển của Viện Cơ khí động lực (Học viện Kỹ thuật Quân sự), bề dày truyền thống không chỉ được bồi đắp bởi những kết quả nổi bật trong công tác giáo dục - đào tạo, nghiên cứu khoa học, mà còn kết tinh từ trí tuệ, tâm huyết của những 'người lái đò' thầm lặng và Giáo sư, Tiến sĩ (GS, TS) Chu Văn Đạt là một gương mặt tiêu biểu - một nhà khoa học mặc áo lính tiên phong, luôn kiên trì theo đuổi con đường nghiên cứu ứng dụng và tận tâm kiến tạo những thế hệ tinh hoa.

Phát triển kinh tế không gian tầm thấp: Taxi bay sắp xuất hiện ở Hà Nội

6 giờ

UBND thành phố Hà Nội vừa ban hành Quyết định số 2512/QĐ-UBND về việc phê duyệt Quy hoạch tổng thể Thủ đô tầm nhìn 100 năm, trong đó sẽ nghiên cứu, phát triển mô hình taxi bay (eVTOL-electric Vertical Takeoff and Landing).

Tin mới

Đại học trước sứ mệnh mới của đất nước

13 phút

Tại lễ kỷ niệm 120 năm ngày truyền thống Đại học Quốc gia Hà Nội, Tổng Bí thư Tô Lâm đặt ra yêu cầu mới với giáo dục đại học Việt Nam: đại học phải trở thành nơi kiến tạo tri thức, công nghệ, năng lực cạnh tranh và góp phần nâng tầm vị thế quốc gia trong chặng phát triển mới của đất nước.

5 dấu hiệu nhận biết ngoại tình qua smartphone, điểm thứ 5 rất khó phát hiện

Chuyên trang Gia Đình & Xã Hội - Báo Sức khỏe & Đời sống

14 phút

Trong thời đại số, smartphone không chỉ là công cụ liên lạc mà còn trở thành 'kho bí mật' chứa gần như toàn bộ đời sống cá nhân của mỗi người. Từ tin nhắn, hình ảnh, lịch sử tìm kiếm đến vị trí di chuyển, tất cả đều được lưu lại trên chiếc điện thoại nhỏ bé ấy.

Singapore xuất hiện lừa đảo bằng AI mạo danh Thủ tướng

20 phút

Lực lượng Cảnh sát Singapore thu thập được video ghi lại cuộc họp trực tuyến được dàn dựng bằng trí tuệ nhân tạo (AI) để tạo cảm giác như có sự tham gia của Thủ tướng Lawrence Wong.

Công tác chế tạo máy bay chở khách Tu-454 đang được gấp rút tiến hành

1 giờ

Nhu cầu của hàng không Nga đối với một máy bay chở khách thân rộng như chiếc Tu-454 rõ ràng là rất lớn.

Tạo giá trị kinh tế - xã hội thông qua thương mại hóa công nghệ và phát triển doanh nghiệp khoa học công nghệ

1 giờ

Nghị quyết số 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị cho thấy quyết tâm của Đảng, Nhà nước trong việc đưa khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số trở thành động lực phát triển mới của đất nước. Để đạt được những mục tiêu đó, cùng với việc ban hành chính sách, tăng đầu tư riêng lẻ cho từng thành phần trong hệ sinh thái, Việt Nam đang hình thành cơ chế kết nối thực chất giữa Nhà nước - Đại học - Doanh nghiệp - Nhà đầu tư - Xã hội.

Robot tuần tra, phần mềm học lịch sử VR xuất hiện ở Hội thi Tin học trẻ thành phố Hà Nội

2 giờ

Là hoạt động thường niên dành cho thanh thiếu nhi Thủ đô do Đoàn Thanh niên, Hội đồng Đội phối hợp Sở Giáo dục và Đào tạo Hà Nội tổ chức, Hội thi Tin học trẻ thành phố Hà Nội đã bước sang lần tổ chức thứ 31. Năm nay, vòng chung kết Hội thi diễn ra ngày 17/5 theo hình thức tập trung với nhiều sản phẩm đầy sáng tạo.

Tin không vui với mẫu iPhone gập đầu tiên của Apple trước 'giờ G'

2 giờ

Mẫu iPhone gập đầu tiên của Apple đang gặp một sự cố trong giai đoạn hoàn thiện, làm dấy lên nguy cơ thiết bị tiếp tục lỡ hẹn sau nhiều năm được chờ đợi.

Arizona thành 'thung lũng chip AI', trả giá cực đắt

2 giờ

Arizona đang hút hơn 200 tỷ USD đầu tư bán dẫn và AI, nhưng phía sau 'giấc mơ chip' là áp lực nước, điện và môi trường giữa sa mạc nóng nhất nước Mỹ.