AI phá mật mã cổ, hé lộ những bí mật chưa từng được đọc suốt hàng trăm năm

Trong các thư viện và kho lưu trữ trên khắp thế giới, có những thông điệp và tài liệu lịch sử ẩn sau các mật mã khó hiểu. Trí tuệ nhân tạo (AI) đang giúp các nhà sử học giải mã những văn bản bí ẩn này.

6 giờ trướcGốc

Một đoạn văn bản viết bằng mật mã. Ảnh: Beáta Megyesi

Theo kênh BBC ngày 28/5, sâu trong kho lưu trữ của Thư viện Vatican, một cuốn sách viết tay bí ẩn đầy những ký hiệu kỳ lạ đã nằm im không người đọc suốt hơn 400 năm. Những trang sách khó hiểu dường như che giấu các bài thuốc bí mật chữa những căn bệnh của con người. Những phương pháp chữa bệnh như vậy từng bị giữ kín vì có thể làm dấy lên nghi ngờ hoặc thậm chí dẫn tới cáo buộc phù thủy.

Được gọi là mật mã Borg, bản thảo dài 408 trang này hầu như không ai đọc được. Văn bản được mã hóa bằng 34 ký hiệu khó hiểu cùng một số chữ cái La Mã và trang đầu được viết bằng tiếng Arab. Không có chìa khóa nào để giải mã nội dung đằng sau. Một số trang cũng bị hư hỏng theo thời gian, khiến việc đọc mã càng khó khăn hơn.

Tuy nhiên, với sự hỗ trợ của học máy, các nhà nghiên cứu đã giải mã được văn bản này. Họ phát hiện nội dung chứa hàng nghìn phương pháp điều trị kỳ lạ, như uống nhiều ly rượu vang đỏ chất lượng cao hoặc ủ hạt nhục đậu khấu trong bột nhào để chữa bệnh lỵ.

Bà Beáta Megyesi, Giáo sư ngôn ngữ học tính toán tại Đại học Stockholm ở Thụy Điển và là thành viên nhóm giải mã văn bản, cho biết: “Điều này giống như công việc của thám tử, nơi mỗi ký hiệu, mô hình và lời giải từng phần đều có thể đưa chúng tôi đến gần hơn với những bí mật của một ai đó và một thế giới lịch sử đã mất”.

Ngay cả khi có AI hỗ trợ, quá trình giải mã vẫn rất gian nan.

Hiện nay, bà Megyesi và các đồng nghiệp đang dẫn đầu nỗ lực tận dụng sức mạnh AI để phá giải các mật mã lịch sử, mở ra khả năng tiếp cận kho thông tin được mã hóa trong quá khứ mà trước đây gần như không thể giải mã.

Theo một số ước tính, khoảng 1% tài liệu trong các kho lưu trữ và thư viện trên toàn thế giới được mã hóa toàn bộ hoặc một phần. Một số mật mã cổ nhất được biết đến có niên đại từ thời Hy Lạp và La Mã cổ đại.

Mồi nhử, ngôn ngữ chết và chữ viết khó đọc

Các tài liệu lịch sử được mã hóa che giấu thông tin tình báo ngoại giao, nghi thức của các hội kín, kiến thức y học, chuyện tình cảm hoặc các chi tiết đời thường mà con người muốn giữ bí mật. Đây là những thông tin còn thiếu trong các ghi chép lịch sử hiện nay.

Trong một số trường hợp, việc giải mã các tài liệu này có thể làm thay đổi hiểu biết của con người về một nhân vật nổi tiếng hoặc cả một giai đoạn lịch sử. Một ví dụ gần đây là bộ thư mã hóa được xác định do Nữ hoàng Mary I của Scotlands viết trong thời gian dài bị giam giữ tại Anh. Những bức thư hé lộ vai trò của bà trong các âm mưu giành lại ngai vàng và mối quan hệ căng thẳng với con trai là James VI và I.

Các mật mã lịch sử đôi khi tương đối đơn giản. Ví dụ, mật mã Borg sử dụng phương pháp thay thế ký tự, nghĩa là mỗi ký hiệu tương ứng với một chữ cái La Mã để che giấu nội dung. Tuy nhiên, một số mật mã khác cực kỳ khó phá giải.

Trong vài trường hợp, giới nghiên cứu thậm chí không biết ngôn ngữ gốc của văn bản chưa mã hóa. Một số ký hiệu vô nghĩa còn được thêm vào làm mồi nhử nhằm đánh lạc hướng những người cố giải mã. Ở những trường hợp khác, nhiều ký hiệu khác nhau lại cùng đại diện cho một chữ cái.

Điều này khiến công việc giải mã trở nên vô cùng tốn thời gian và thường phải thử sai liên tục để giải được chỉ một đoạn văn ngắn.

Bà Cecile Pierrot, nhà mật mã học tại Viện Nghiên cứu Khoa học Máy tính Quốc gia Pháp ở Nancy, cùng các đồng nghiệp đã mất sáu tháng để dần giải mã bức thư 500 năm tuổi của Charles V, Hoàng đế La Mã Thần thánh kiêm Vua Tây Ban Nha. Bức thư được viết bằng 120 ký hiệu mật mã khác nhau trên ba trang giấy.

Bức thư sau khi giải mã cho thấy Charles V (một trong những người quyền lực nhất thời đại) đã bị nỗi sợ ám sát chi phối. Nhà vua lo ngại một thủ lĩnh lính đánh thuê Italy phục vụ Vua Francis I của Pháp chuẩn bị sát hại ông.

Trước khi bắt đầu giải mã, các nhà nghiên cứu phải tỉ mỉ chuyển văn bản viết tay thành tài liệu số để đưa vào phần mềm phá mã. Chữ viết khó đọc và mực phai màu khiến công việc càng phức tạp.

Bà Pierrot cho biết bà thường mất cả ngày chỉ để chép lại một bức thư dài hai trang chứa những ký hiệu xa lạ.

AI giúp tăng tốc giải mã bí mật

Tuy nhiên, AI đang bắt đầu đẩy nhanh quá trình này.

Bà Michelle Waldispühl, Giáo sư ngôn ngữ học Đức tại Đại học Oslo ở Na Uy, cùng các đồng nghiệp gần đây đã sử dụng nền tảng AI trực tuyến Transkribus để chép lại một bức thư mật do nhà quý tộc Sigismund Heusner von Wandersleben gửi cho Đại pháp quan Thụy Điển Axel Oxenstierna năm 1637, vào cao điểm của Chiến tranh Ba mươi năm - cuộc xung đột tôn giáo khiến hàng triệu người thiệt mạng và tàn phá nhiều khu vực ở châu Âu.

Công cụ này được huấn luyện trên nhiều ngôn ngữ, kiểu chữ và phong cách viết tay qua nhiều thế kỷ. Sau khi hình ảnh tài liệu được tải lên, AI sẽ nhận diện các khối văn bản và từng dòng trước khi quét từng ký tự để chuyển thành dạng số.

Dù vẫn cần chỉnh sửa thủ công, nhưng công cụ hoạt động khá hiệu quả với bức thư của Von Wandersleben vì chỉ một phần được mã hóa bằng các con số ngăn cách bằng dấu chấm và được viết rõ ràng. Các phần còn lại được viết bằng chữ Đức thế kỷ 17.

Các nền tảng AI hiện nay thường gặp khó khăn khi bản thảo sử dụng các ký hiệu bất thường như ký hiệu tự tạo, biểu tượng chiêm tinh học hoặc các con số viết theo cách lạ.

Tuy nhiên, bà Megyesi, bà Waldispühl và các đồng nghiệp đang phát triển công cụ AI riêng trong khuôn khổ dự án đa quốc gia Descrypt nhằm chuyển đổi các văn bản lịch sử viết tay chứa ký hiệu khó hiểu thành tài liệu máy có thể đọc được.

Sau khi tài liệu mật được số hóa, công việc “thám tử” mới bắt đầu.

Hiện nay, các nhà mật mã học thường sử dụng phần mềm máy tính chuyên dụng để hỗ trợ giải mã. Các thuật toán sẽ cố xác định loại mật mã được sử dụng và phá mã. Những mật mã đơn giản có thể được giải bằng cách phân tích tần suất xuất hiện của ký hiệu và đối chiếu với tần suất chữ cái trong một ngôn ngữ.

Ví dụ, trong tiếng Anh, chữ E xuất hiện nhiều nhất, còn Z, Q và X ít xuất hiện nhất.

Tuy nhiên, trong bức thư của Von Wandersleben từ tiền tuyến Chiến tranh Ba mươi năm, ông đã sử dụng tới tám ký hiệu khác nhau để đại diện cho chữ E. Điều này buộc các nhà nghiên cứu phải liên tục thử sai kết hợp với hiểu biết của bà Waldispühl về tiếng Đức cổ để dần phá mã.

Ẩn sau lớp mật mã là những cảnh báo của Von Wandersleben về mối đe dọa từ các phe phái trong liên minh Tin Lành của Thụy Điển. Ông cho biết mình buộc phải rút lui chiến lược khỏi cuộc chiến sau khi được thông báo về một âm mưu trong nội bộ đồng minh,.

Phá lại các mật mã bí ẩn tồn đọng

Hiện nhóm của bà Megyesi đang nghiên cứu khả năng để AI bỏ qua hoàn toàn bước chép lại văn bản, bằng cách phân tích trực tiếp ảnh chụp các trang tài liệu để giải mã thông điệp bí mật.

Họ gần đây đã chứng minh phương pháp này có thể hoạt động với các loại mật mã đơn giản, trong đó mỗi chữ cái được thay bằng một ký hiệu duy nhất.

Nhóm nghiên cứu thử nghiệm hệ thống trên bản thảo dài 105 trang mang tên mật mã Copiale, vốn đã được họ giải mã trước đó. Văn bản này mô tả nghi lễ, quy tắc và lý tưởng của một hội kín Đức thế kỷ 18.

Sau khi huấn luyện AI bằng chữ viết tay thông thường, rồi bổ sung hình ảnh các dòng mật mã và bản tiếng Đức đã giải mã tương ứng, hệ thống có thể giải chính xác các phần văn bản chưa từng thấy trước đó.

Theo bà Megyesi, hệ thống như vậy đặc biệt hữu ích khi ngôn ngữ gốc của mật mã chưa được xác định.

Bà Waldispühl và các đồng nghiệp cũng đang tìm kiếm các bản thảo mật mã trong những kho lưu trữ cũ để xây dựng cơ sở dữ liệu. Điều này rất quan trọng nhằm thu thập đủ dữ liệu huấn luyện AI có khả năng phá mã.

Các mô hình ngôn ngữ lớn đứng sau chatbot AI như ChatGPT được huấn luyện trên hàng nghìn tỷ từ trong sách, bài báo và trang web. Tuy nhiên, việc tìm lượng dữ liệu tương đương cho nhiệm vụ phá mã là rất khó.

Trong số tài liệu thu thập được có 400 bưu thiếp bí ẩn viết bằng chữ mã hóa từ cuối thế kỷ 19 tới đầu thế kỷ 20. Một số đoạn đã giải mã cho thấy đây là các bức thư tình viết bằng tiếng Đức.

Nhóm của bà Megyesi đã phát triển một công cụ AI dạng chatbot kết hợp phiên âm và giải mã trong cùng một bước.

Chatbot này kết hợp các thuật toán giải mã được huấn luyện trên cặp ký tự mật mã và văn bản tương ứng, cùng các mô hình ngôn ngữ lớn được huấn luyện trên văn bản lịch sử từ nhiều giai đoạn khác nhau để đưa ra manh mối về mã hóa. Các thuật toán nhận diện hình ảnh được huấn luyện trên chữ viết tay chú thích cũng được tích hợp.

Công cụ AI còn có khả năng tự cải thiện bằng cách tiếp nhận các chỉnh sửa từ chuyên gia sử dụng hệ thống.

Ý tưởng là các nhà nghiên cứu, hoặc thậm chí công chúng, có thể đưa một văn bản lịch sử mã hóa cho chatbot và để hệ thống tiết lộ nội dung.

Mật mã Borg có niên đại khoảng 400 năm, chứa các ký hiệu mật mã kỳ lạ cùng một số chữ Latinh dài 408 trang. Ảnh: Biblioteca Apostolica Vaticana

Khi thử nghiệm chatbot AI với mật mã Borg, bà Megyesi và các đồng nghiệp phát hiện hệ thống có thể dịch và giải mã đoạn trích 500 ký hiệu chỉ trong hơn 29 phút. Hệ thống thậm chí còn cung cấp bản dịch tiếng Anh.

Quan trọng hơn, công cụ cũng ghi lại toàn bộ quá trình và giải thích vì sao lời giải được xem là hợp lý. Điều này giúp bảo đảm AI không “ảo giác” hoặc tự bịa ra cách diễn giải.

Những công cụ AI như vậy có thể đóng vai trò then chốt trong việc phá giải các mật mã lịch sử vốn chưa thể giải được cho tới nay. Chúng cũng sẽ hỗ trợ nghiên cứu các văn bản cổ viết bằng bảng chữ cái mà ngày nay không ai còn đọc được.

Thùy Dương/Báo Tin tức và Dân tộc

Nguồn Tin Tức TTXVN: https://baotintuc.vn/ho-so/ai-pha-mat-ma-co-he-lo-nhung-bi-mat-chua-tung-duoc-doc-suot-hang-tram-nam-20260529175559102.htm

Phát hiện cổ vật 800 năm tuổi trong hố xí Trung cổ ở Đức, lộ cả 'giấy vệ sinh lụa'

3 giờ

Thế giới virus đang biến đổi khó lường

42 phút

Người đầu tiên được giải cứu an toàn khỏi hang ngập nước tại Lào

2 giờ

Tin nóng

Robot tự hành trên sao Hỏa lấy cảm hứng từ thằn lằn sa mạc

5 giờ

Các nhà nghiên cứu tại Đại học Würzburg (Đức) phát triển robot tự hành trên sao Hỏa lấy cảm hứng từ thằn lằn sa mạc.

'Cá sấu quái vật' không răng, đi bằng 2 chân được phát hiện ở Mỹ

11 giờ

Quái vật Labrujasuchus expectatus 212 triệu tuổi trông giống một con khủng long kỳ dị 'lai' với cá sấu.

Khoảng 16% diện tích băng ở Nam Cực chịu tác động của sóng biển

5 giờ

Nghiên cứu đăng tải trên tạp chí Nature Communications cho thấy khoảng 16% diện tích băng biển ở Nam Cực đang chịu tác động từ những con sóng dữ dội của Nam Đại Dương. Phát hiện này mang lại một bức tranh rõ nét đầu tiên về một khu vực quan trọng nhưng chưa được nghiên cứu kỹ lưỡng, gọi là Vùng băng biên (MIZ) - vùng băng biển tiếp xúc trực tiếp với đại dương.

Bức tranh nổi tiếng 'Đêm đầy sao' từ đâu mà có?

7 giờ

Sự cận kề của một 'ngôi sao' với Trăng lưỡi liềm vẫn là biểu tượng thiêng liêng của đức tin. Vincent van Gogh cũng không thể làm ngơ.

Người dân liên tiếp phát hiện, giao nộp cá thể rùa núi viền quý hiếm, nguy cấp

4 giờ

Chiều 29/5, đại diện lãnh đạo Vườn quốc gia Pù Mát (tỉnh Nghệ An) xác nhận thông tin và cho biết, trong ngày 28/5 đơn vị đã tiếp nhận 2 cá thể rùa núi viền quý hiếm do chính quyền các địa phương, cơ quan chức năng phối hợp bàn giao để chăm sóc, theo dõi trước khi thả về môi trường tự nhiên.

Bí ẩn hàng trăm cấu trúc hình tròn khổng lồ trên bề mặt sao Kim

10 giờ

Hàng trăm cấu trúc hình tròn khổng lồ trên bề mặt sao Kim có thể giúp giải mã phần bên trong của hành tinh có khối lượng gần bằng Trái đất.

Tin mới

Các nhà khoa học phát hiện hộp sọ con người đã thay đổi rõ rệt chỉ sau 100 năm khiến giới nghiên cứu bất ngờ

Chuyên trang Gia Đình & Xã Hội - Báo Sức khỏe & Đời sống

3 giờ

Một nghiên cứu mới từ Nhật Bản cho thấy hình dạng hộp sọ con người hiện đại đã khác đáng kể so với tổ tiên cách đây chỉ vài thế hệ, mở ra nhiều câu hỏi lớn về tác động của lối sống hiện đại lên cơ thể người.

Tạo ngân hàng sinh học bảo tồn động vật trên Mặt Trăng

4 giờ

Liệu Mặt trăng có thể cứu các loài động vật đang có nguy cơ tuyệt chủng trên Trái đất?

Những rủi ro khi bóng tối tự nhiên bị che lấp bởi ánh sáng nhân tạo

5 giờ

Ánh sáng nhân tạo đang ngày càng lấn át bóng tối tự nhiên, khiến ánh trăng và các vì sao dần biến mất khỏi bầu trời đêm ở nhiều khu vực trên thế giới. Các nhà khoa học cảnh báo hiện tượng này không chỉ làm giảm khả năng quan sát thiên văn mà còn gây ảnh hưởng đáng kể đến sức khỏe con người và sự cân bằng sinh thái.

Tên lửa Blue Origin phát nổ trên bệ phóng khi thử nghiệm

7 giờ

Tên lửa New Glenn của Blue Origin đã phát nổ trong quá trình thử nghiệm đốt động cơ tại bệ phóng ở khu vực Cape Canaveral, bang Florida, Mỹ, tạo ra quả cầu lửa lớn và làm rung chuyển nhiều khu dân cư lân cận.

Sóng biển ảnh hưởng đến 16% bang ở Nam Cực

7 giờ

Các chuyên gia Australia vừa công bố kết quả nghiên cứu dựa trên những tiến hành đo đạc được tại Vùng băng ven biển: Khoảng 16% bang ở biển Nam Cực bị ảnh hưởng bởi sóng đến từ vùng biển Nam Đại Dương.

Khoảnh khắc tên lửa của Blue Origin phát nổ dữ dội trên bệ phóng

7 giờ

Sự cố xảy ra tối 28/5 (giờ Mỹ) tại bang Florida khi Blue Origin tiến hành thử nghiệm đốt tĩnh đối với New Glenn, tên lửa hạng nặng được phát triển suốt gần 10 năm qua. Hình ảnh được Nasa ghi lại cho thấy tên lửa được kích hoạt động cơ trước khi bất ngờ biến thành một quả cầu lửa lớn, tạo ra cột khói và ngọn lửa bốc cao trên bầu trời. Blue Origin xác nhận đã xảy ra một 'sự cố bất thường' trong quá trình thử nghiệm. NASA cho biết sẽ xem xét ảnh hưởng của sự cố đối với chương trình Artemis và kế hoạch xây dựng căn cứ lâu dài trên Mặt Trăng.

Tên lửa phát nổ ngay trên bệ phóng, tham vọng không gian của ông trùm Amazon gặp trở ngại

8 giờ

Tên lửa không người lái New Glenn của Blue Origin đã phát nổ trên bệ phóng tại bang Florida trong một cuộc thử nghiệm ngày 28/5, giáng thêm một đòn vào tham vọng không gian của tỷ phú Jeff Bezos trong bối cảnh công ty đang nỗ lực thu hẹp khoảng cách với SpaceX của tỷ phú Elon Musk.

Tên lửa của tỷ phú Jeff Bezos phát nổ ngay trên bệ phóng

8 giờ

Tên lửa của hãng Blue Origin thuộc sở hữu của tỷ phú Jeff Bezos vừa phát nổ trong lúc thử nghiệm trên bệ phóng, làm rung chuyển các ngôi nhà gần đó và khiến bầu trời rực lên màu cam.