Ứng dụng AI vào nghệ thuật và thời trang
Việc sử dụng trí tuệ nhân tạo (AI) trong ngành thời trang đã phát triển đáng kể trong những năm gần đây. AI đang được sử dụng cho một số nhiệm vụ như cá nhân hóa các đề xuất thời trang cho khách hàng, tối ưu hóa quản lý chuỗi cung ứng, tự động hóa quy trình và cải thiện tính bền vững để giảm lãng phí.
AI trong thiết kế thời trang
Tuy nhiên, những quy trình sáng tạo trong thiết kế thời trang hầu hết vẫn do con người điều khiển và không có nhiều nghiên cứu tồn tại trong lĩnh vực sử dụng AI để thiết kế thời trang. Hơn nữa, nhiều nghiên cứu thường được thực hiện với cộng đồng nhà khoa học dữ liệu - những người xây dựng nền tảng AI và tham gia vào khía cạnh công nghệ của quy trình. Tuy nhiên, mặt khác của phương trình này - tức là bản thân nhà thiết kế, không thường xuyên nghiên cứu.
Để tìm hiểu khả năng ứng dụng thực tế của các mô hình AI nhằm thực hiện những thiết kế sáng tạo và làm việc với nhà thiết kế con người, Giáo sư Yoon Kyung Lee từ Đại học Quốc gia Pusan (Hàn Quốc) đã tiến hành một nghiên cứu chuyên sâu và giải thích về động lực của nghiên cứu này: “Vào thời điểm mà AI đã ăn sâu vào cuộc sống của chúng ta, thay vào đó, nghiên cứu này bắt đầu bằng việc xem xét những gì con người có thể làm tốt hơn AI. Liệu có thể có sự hợp tác hiệu quả giữa con người và AI cho mục đích thiết kế sáng tạo không?”.
Giáo sư Lee bắt đầu với việc tạo ra những thiết kế dệt may mới bằng cách sử dụng mạng sáng tạo đối nghịch (GAN). Kết quả đầu ra từ nhóm mô hình này được so sánh với những thiết kế tương tự do sinh viên thiết kế tạo ra. So sánh cho thấy rằng mặc dù thiết kế do cả hai sản xuất đều giống nhau, nhưng điểm khác biệt lớn nhất là tính độc đáo được thấy trong thiết kế của con người, xuất phát từ trải nghiệm của người đó. Tuy nhiên, việc sử dụng AI trong hàng loạt nhiệm vụ lặp đi lặp lại có thể cải thiện hiệu quả của nhà thiết kế và giải phóng thời gian của họ để tập trung vào công việc sáng tạo có độ khó cao hơn.
Thiết kế do AI tạo ra cũng có thể được sử dụng như công cụ học tập cho những người thiếu chuyên môn về thời trang muốn khám phá khả năng sáng tạo của họ. Những người này có thể tạo ra mẫu thiết kế với sự hỗ trợ của AI. Do đó, Giáo sư Lee đề xuất một mạng cộng tác giữa con người và AI tích hợp GAN cùng với sự sáng tạo của con người để tạo ra mẫu thiết kế. Giáo sư cũng đã xác định và nghiên cứu nhiều yếu tố khác nhau của một hệ thống phức tạp có liên quan đến thiết kế hợp tác giữa con người và AI.
Ông Lee cũng tiếp tục thiết lập một mô hình AI - con người, trong đó nhà thiết kế hợp tác với AI tạo ra ý tưởng thiết kế mới lạ. Mô hình được xây dựng theo cách mà nếu nhà thiết kế chia sẻ quá trình sáng tạo và ý tưởng của họ với những người khác, thì hệ thống có thể kết nối và phát triển, từ đó cải thiện thiết kế.
Ngành thời trang có thể tận dụng điều này để thấy trước những thay đổi trong ngành và đưa ra những đề xuất cũng như dịch vụ đồng sáng tạo. Đặt mục tiêu, biến số và giới hạn là một phần công việc của nhà thiết kế trong môi trường thiết kế hợp tác giữa con người và AI. Do đó, công việc của họ không chỉ dừng lại ở khía cạnh thị giác mà thay vào đó bao gồm nhiều lĩnh vực khác nhau.
Giáo sư Lee kết luận: “Trong tương lai, mọi người sẽ có thể trở thành nhà sáng tạo hoặc nhà thiết kế với sự trợ giúp của các mô hình AI. Cho đến nay, chỉ những nhà thiết kế thời trang chuyên nghiệp mới có thể thiết kế và giới thiệu quần áo. Nhưng trong tương lai, bất kỳ ai cũng có thể thiết kế quần áo họ muốn và thể hiện sự sáng tạo của họ”.
Mạng sáng tạo đối nghịch để tạo ra tác phẩm nghệ thuật
Bạn sẽ dạy thuật toán máy tính cách vẽ một con chó như thế nào? Giống như một đứa trẻ đang cố gắng vẽ một con chó lần đầu tiên, bạn có thể bắt đầu bằng cách cho nó những hình ảnh khác nhau về những con chó, để có được ý tưởng chung về con chó trông như thế nào và những đặc điểm tạo nên con chó. Bằng cách tạo hình ảnh một chú chó của riêng mình, sau đó so sánh nó với loạt hình ảnh trong tập dữ liệu, theo thời gian, thuật toán sẽ “học” cách tạo ra một bức chân dung con chó.
Quá trình khiến máy học từ dữ liệu trước đây mà không cần lập trình mới là cách hoạt động của máy học. Quá trình này sử dụng cái được gọi là mạng thần kinh hoặc một loạt thuật toán được thiết kế để nhận ra những mối quan hệ cơ bản trong một tập hợp dữ liệu thông qua một quá trình bắt chước cách bộ não con người hoạt động.
Khi dữ liệu mới được thêm vào, mạng nơron thứ “n” có thể thích ứng nhằm tạo ra kết quả tốt nhất có thể mà không cần thiết kế lại các tiêu chí đầu ra. Có nhiều loại kiến trúc và kỹ thuật học máy khác nhau được nhà nghiên cứu sử dụng. Tuy nhiên, khi sáng tạo nghệ thuật, một kỹ thuật thường được sử dụng được gọi là Mạng sáng tạo đối nghịch (GAN).
Được phát triển ban đầu bởi Ian Goodfellow, GAN là loại kỹ thuật máy học sử dụng hai mạng nơ-ron (neuron), ghép một mạng này vào mạng kia để tạo ra một đầu ra có thể chuyển cho dữ liệu thực. GAN có thể được sử dụng hiệu quả để tạo ra tác phẩm nghệ thuật, trong số những thứ khác. Nhưng chúng hoạt động như thế nào? GAN cấu tạo gồm 2 mạng là Generator (Bộ tạo sinh) và Discriminator (Bộ phân biệt).
Trong khi Generator sinh ra loạt dữ liệu giống như thật thì Discriminator cố gắng phân biệt đâu là dữ liệu được sinh ra từ Generator và đâu là dữ liệu thật. Giả sử chúng ta muốn huấn luyện người mẫu tạo ra bức chân dung chó có từ thế kỷ 19 của riêng mình.
Trước tiên, chúng ta sẽ cho Bộ tạo sinh xem hàng nghìn bức tranh vẽ những chú chó ở nhiều kích cỡ và giống khác nhau, để nó có thể tìm hiểu những yếu tố khác nhau tạo nên một chú chó. Bộ tạo sinh sử dụng thông tin trong tập dữ liệu tạo ra bức tranh vẽ một con chó. Sau đó, Bộ phân biệt sẽ cố gắng phát hiện sự khác biệt giữa bức tranh tổng hợp và bức tranh do con người tạo ra từ tập dữ liệu.
Khi Bộ phân biệt phát hiện ra “giả”, Bộ tạo sinh “học” được rằng cách nỗ lực của nó không thành công và thử lại. Ban đầu, Bộ tạo sinh tạo ra nhiều bức tranh không giống chó đến mức đánh lừa Bộ phân biệt. Tuy nhiên, Bộ tạo sinh cũng học hỏi từ phản hồi liên tục của Bộ phân biệt. Cuối cùng, nó tạo ra những bức chân dung chó ngày càng giống chó, cho đến khi cuối cùng nó có thể đánh lừa Bộ phân biệt rằng những bức ảnh mới là chân dung đời thực. Kết quả cuối cùng là nghệ thuật của chúng ta.
Một trong những điều đặc biệt nhất về GAN là bạn có thể sử dụng kiến trúc cơ bản và đào tạo mô hình trên bất kỳ tập dữ liệu nào bạn muốn. Phương pháp này có thể được sử dụng không chỉ cho nghệ thuật mà còn cho giọng nói, văn bản và thậm chí cả khuôn mặt. Một loạt yếu tố như kích thước của tập dữ liệu, các tính năng cơ bản của dữ liệu, thời gian bạn dành để đào tạo mô hình của mình và loại mô hình GAN đều ảnh hưởng đến kết quả cuối cùng. Bằng cách sử dụng nhiều loại tập dữ liệu khác nhau, chúng ta có thể tạo ra thứ gì đó siêu thực hoặc mơ mộng và trừu tượng như chân dung Edmond Belamy.
Nghệ sĩ, nhà nghiên cứu và nhà khoa học dữ liệu đang khai thác sức mạnh của Mạng đối thủ chung tạo ra kiệt tác nghệ thuật. Một trong những nhân vật nổi bật nhất trong lĩnh vực nghệ thuật đang phát triển này là Tom White - nghệ sĩ người New Zealand và giảng viên về thiết kế tính toán. White hợp tác với hệ thống AI tạo ra tác phẩm nghệ thuật mô tả thế giới không phải như con người nhìn thấy, mà là các thuật toán.
Đối với con người, các bức ảnh mà thuật toán của White tạo ra trông giống như sự sắp xếp ngẫu nhiên của nhiều đường thẳng và đốm màu. Nhưng đối với thuật toán, chúng được xác định là đối tượng cụ thể: một con cá mập, ống nhòm, một máy cắt cỏ. Các hình ảnh được tạo ra bằng cách chọn một đối tượng và sau đó có một hệ thống bản vẽ tạo ra một số đường trừu tượng. Hình ảnh này được đưa vào bộ phân loại thị giác máy, công cụ này sẽ cố gắng đoán đối tượng đã chọn có thể là gì.
Dựa trên phỏng đoán, hệ thống vẽ sau đó điều chỉnh hình ảnh và cung cấp lại hình ảnh. Quá trình tiếp tục cho đến khi Bộ phân biệt đoán đúng. Tuy nhiên, giống như Kadinsky, Picasso và Miro, đây là những bức tranh trừu tượng. Chúng không phải là ý tưởng của con người về vật thể trông như thế nào, mà là ý tưởng của máy móc - chúng đại diện cho cách thuật toán “nhìn” thế giới. Và điều này, hóa ra, rất khác với cách một con người nhìn thế giới. Công việc của White chỉ là phần nổi của tảng băng chìm.
Nghệ sĩ người Đức Mario Klingemann còn phát triển mạng lưới thần kinh tạo ra những bức chân dung cổ đẹp như mơ, phát triển và “trở nên sống động” trong thời gian thực. Một nghệ sĩ AI khác là Sougwen Chung - người đã tạo ra một hệ thống vẽ cùng với mình để tạo ra những bức tranh tuyệt đẹp.