Kỹ sư trẻ sáng tác âm nhạc bằng công nghệ AI
Vừa là kỹ sư công nghệ thông tin, vừa có khả năng sáng tác và biểu diễn âm nhạc, chàng trai trẻ sinh năm 1994 Nguyễn Hoàng Bảo Đại (trong ảnh) thường được mọi người gọi là 'nhạc sĩ biết code'. Mới đây, anh đã mang đến niềm tự hào cho cộng đồng công nghệ thông tin (IT) Việt khi trở thành người Việt Nam thứ ba được Google công nhận là Google Developer Expert (chuyên gia phát triển của Google) của ngành khoa học máy tính với mô hình sáng tác âm nhạc bằng công nghệ trí tuệ nhân tạo (AI).
Sau khi theo học ngành khoa học máy tính tại Trường đại học Khoa học tự nhiên TP Hồ Chí Minh, Nguyễn Hoàng Bảo Đại trở thành kỹ sư nghiên cứu về AI trong lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính, song anh chưa bao giờ từ bỏ đam mê sáng tác âm nhạc đã theo mình từ nhỏ. Video ca nhạc “Dân IT” do anh sáng tác và biểu diễn đã nhận được sự yêu thích của đông đảo người làm công nghệ với hàng chục nghìn lượt xem trên YouTube. Bảo Đại cho biết, anh có thói quen sáng tác giai điệu trước rồi mới đến hợp âm và lời. Đây cũng là khâu khiến anh mất nhiều thời gian và tâm huyết nhất bởi bản thân quan niệm một ca khúc hay trước hết phải có những giai điệu đẹp. Nhiều bài hát mất tới cả tháng trời anh mới xong giai điệu vì viết xong lại chỉnh, thành hình lại sửa… Từ thực tế này, chàng kỹ sư trẻ đã lóe lên ý định dùng chính những kiến thức chuyên môn được học về trí tuệ nhân tạo để hỗ trợ thực hiện đam mê âm nhạc của mình. “Tôi nghĩ AI có thể vẽ tranh thì cũng có thể viết nhạc. Vì thế, tôi dự định làm một mô hình AI viết nhạc cho người Việt theo thị hiếu của người Việt” - Bảo Đại chia sẻ.
Đầu năm 2017, anh chính thức bắt tay vào nghiên cứu. Sau hai năm mày mò tìm hiểu, triển khai, mô hình AI sáng tác âm nhạc đã ra đời và gây bất ngờ cho bất cứ ai biết đến với khả năng có thể viết mười giai điệu bài hát chỉ trong một giây. Bằng mô hình này, người sáng tác chỉ cần đưa ra vài nốt nhạc, hệ thống sẽ xử lý dữ liệu, chuyển giai điệu đầu vào thành véc-tơ nhiều số và đầu ra sẽ là những giai điệu dài hơn. Thuật toán ngẫu nhiên của AI cho phép hệ thống tạo ra những phiên bản giai điệu hoàn toàn khác nhau để người nghe lựa chọn, từ đó tiếp tục điều chỉnh theo ý muốn. Mô hình này giúp các nhạc sĩ có thể rút ngắn công đoạn làm giai điệu bằng cách đưa ra những gợi ý để khơi gợi cảm hứng, từ đó nhạc sĩ có nhiều thời gian hơn để trau chuốt cho những khâu còn lại như hòa âm, phối khí, viết lời.
Bảo Đại cho hay, trên thế giới cũng đã có nghiên cứu về mô hình AI trong âm nhạc, song những mô hình này chủ yếu hướng đến sáng tác nhạc cổ điển, khác nhiều so với thị hiếu nghe nhạc của người Việt Nam. Vì thế, muốn có một mô hình sáng tác âm nhạc bằng trí tuệ nhân tạo với những bản nhạc nhẹ, pop ballad dễ nghe, phù hợp với người Việt thì anh buộc phải xây dựng những thuật toán riêng. Thách thức lớn nhất mà chàng “nhạc sĩ kỹ sư” gặp phải là việc tìm kiếm nguồn dữ liệu đầu vào sao cho đủ lớn để có thể huấn luyện mô hình. Muốn mô hình có khả năng sáng tác nhạc trẻ thì phải có nguồn dữ liệu về nhạc trẻ. Tuy nhiên, dữ liệu này không thể lấy từ những bài hát trên YouTube hay các trang nghe nhạc vì đây là những sản phẩm đầu cuối đã hoàn chỉnh, trong khi hệ thống chỉ có thể đọc, hiểu những dữ liệu đầu vào dưới dạng file midi. Để giải được bài toán này, Bảo Đại chỉ còn cách dành ra nhiều ngày để tự đánh và thu lại giai điệu các bài nhạc trẻ của Việt Nam trên đàn pi-a-nô điện và xử lý chúng thành dạng midi. Trong số 30.000 file bài hát mà mô hình đang sử dụng, chỉ có khoảng 5.000 bài Bảo Đại tìm được ở những diễn đàn âm nhạc do bạn bè chia sẻ, 25.000 bài còn lại do anh tự đánh để chuẩn hóa dữ liệu. Có những ngày anh thức thâu đêm suốt sáng để đánh lại 200 đến 300 bài hát…
Cùng với đó là thách thức về hệ thống vận hành, bởi những máy tính để bàn hay laptop thông thường không đủ năng lượng tính toán để có thể huấn luyện trí tuệ nhân tạo, còn nếu đầu tư cả một dàn máy thì quá sức về kinh phí với một chàng kỹ sư trẻ. Vậy là dồn hết vốn liếng, Đại lựa chọn phương thức thuê máy, sử dụng điện toán đám mây và trả phí theo nhu cầu sử dụng. Trong quá trình xây dựng mô hình, anh mong muốn có được những người bạn đồng hành vừa hiểu về âm nhạc, vừa có kỹ năng về AI để cùng chia sẻ, nhưng tìm được người hội đủ những yếu tố này dường như quá khó. Một mình phải cặm cụi “chinh chiến” khiến mọi việc có phần gian nan hơn, song bù lại, thành quả nghiên cứu của chàng kỹ sư trẻ đã thật sự khiến mọi người nể phục.
Đặt câu hỏi về việc liệu tính ưu việt của mô hình làm nhạc bằng AI có làm tăng tính phụ thuộc vào công nghệ, hạn chế khả năng sáng tạo âm nhạc của nhạc sĩ hay không, Bảo Đại thẳng thắn khẳng định bản chất của mô hình này là giúp người sáng tác tiết kiệm được thời gian làm nhạc thông qua quá trình tham chiếu, lựa chọn chứ không phải công cụ toàn năng để thay thế công việc của người nhạc sĩ. Mỗi sản phẩm âm nhạc phải mang phong cách, cảm xúc và dấu ấn cá nhân riêng mới có chỗ đứng, cho nên không thể thiếu vai trò sáng tạo chủ đạo của người làm âm nhạc. Bảo Đại cho biết thời gian tới, để tối ưu hóa các tính năng của mô hình, anh sẽ tiếp tục nghiên cứu để phát triển thêm khả năng làm hợp âm, viết lời, đưa mô hình trở thành trợ thủ đắc lực của người sáng tạo âm nhạc.