Runway ra mô hình video vượt mặt Google và OpenAI

Startup trí tuệ nhân tạo Runway hôm 1.12 đã công bố Gen 4.5, một mô hình video mới vượt trội hơn các mô hình tương tự từ Google và OpenAI.

Với chỉ 100 nhân viên, công ty khởi nghiệp trị giá 3,55 tỉ USD này đã chứng minh rằng sự tập trung và chuyên cần có thể đánh bại các gã khổng lồ công nghệ nghìn tỉ USD trong cuộc đua AI tạo video.

Công nghệ vượt trội và vị trí dẫn đầu

Gen 4.5 cho phép người dùng tạo video độ nét cao dựa trên các lời nhắc bằng văn bản mô tả chuyển động và hành động mà họ muốn. Runway cho biết mô hình này giỏi trong việc hiểu vật lý, chuyển động của con người, chuyển động camera và quan hệ nhân quả. Những khả năng này rất quan trọng để tạo ra video trông tự nhiên và thuyết phục, thay vì những cảnh quay kỳ lạ hoặc không thực tế thường thấy ở các mô hình AI tạo video thế hệ đầu.

Video được tạo từ câu lệnh: tik tok how to build online business minimal office desk with computer plant great view outside of ocean through a window two boats in the background and a A female busy working on her laptop camera pans to left

Mô hình này giữ vị trí số một trên bảng xếp hạng Video Arena, được duy trì bởi công ty đánh giá và phân tích AI độc lập Artificial Analysis. Để xác định thứ hạng mô hình văn bản sang video, mọi người so sánh hai đầu ra mô hình khác nhau và bỏ phiếu cho sản phẩm yêu thích của họ mà không biết công ty nào đứng sau chúng. Phương pháp đánh giá mù này đảm bảo tính khách quan và loại bỏ thiên kiến thương hiệu.

Mô hình Veo 3 của Google giữ vị trí thứ hai trên bảng xếp hạng, trong khi mô hình Sora 2 Pro của OpenAI đang ở vị trí thứ bảy. Sự vượt trội này đặc biệt ấn tượng khi xem xét nguồn lực tương đối khiêm tốn của Runway so với các đối thủ lớn. Google và OpenAI đều có quyền truy cập vào nguồn vốn, dữ liệu và sức mạnh tính toán khổng lồ, trong khi Runway phải làm việc với các hạn chế đáng kể hơn.

Giám đốc điều hành Runway Cristóbal Valenzuela nói với CNBC trong một cuộc phỏng vấn: "Chúng tôi đã vượt qua các công ty nghìn tỉ đô la với một đội ngũ 100 người. Bạn có thể đạt đến ranh giới chỉ bằng cách cực kỳ tập trung và cần mẫn”. Tuyên bố này không chỉ là một minh chứng cho năng lực kỹ thuật của Runway mà còn là một thông điệp mạnh mẽ về vai trò của sự chuyên tâm và chiến lược trong đổi mới công nghệ.

Valenzuela cho biết Gen 4.5 có mật danh là "David", ám chỉ câu chuyện trong Kinh thánh về David và Goliath, một câu chuyện biểu tượng về người nhỏ bé đánh bại gã khổng lồ. Mô hình này được Valenzuela mô tả là "một thành công qua đêm mất khoảng bảy năm". Sự tương phản hài hước này nhấn mạnh thực tế rằng những đột phá dường như đột ngột thường là kết quả của nhiều năm nghiên cứu và phát triển kiên trì.

Ông nói: "Cảm giác như một thời điểm rất thú vị khi kỷ nguyên của hiệu quả và nghiên cứu đang đến với chúng ta. Runway rất vui mừng có thể đảm bảo rằng AI không bị độc quyền bởi hai hoặc ba công ty”. Tuyên bố này phản ánh mối quan tâm rộng hơn trong cộng đồng công nghệ về sự tập trung quyền lực AI trong tay một số ít công ty lớn, và tầm quan trọng của việc duy trì một hệ sinh thái cạnh tranh và đa dạng.

Chiến lược và triển vọng phát triển

Runway được thành lập vào năm 2018 và giành được một vị trí trong danh sách Disruptor 50 của CNBC năm nay. Công ty tiến hành nghiên cứu AI và xây dựng các mô hình video và mô hình thế giới, những mô hình được đào tạo trên dữ liệu video và quan sát để phản ánh tốt hơn cách thế giới vật lý hoạt động. Cách tiếp cận này khác với nhiều công ty AI khác tập trung vào xử lý ngôn ngữ hoặc nhận dạng hình ảnh tĩnh.

Khách hàng của startup bao gồm các tổ chức truyền thông, hãng phim, thương hiệu, nhà thiết kế, người sáng tạo và sinh viên. Định giá của công ty đã tăng vọt lên 3,55 tỉ USD, theo PitchBook. Các nhà đầu tư của Runway bao gồm General Atlantic, Baillie Gifford, Nvidia và Salesforce Ventures, cùng những tên tuổi khác. Sự đa dạng trong danh sách nhà đầu tư này, từ các quỹ đầu tư mạo hiểm truyền thống đến các công ty công nghệ lớn như Nvidia, cho thấy sức hấp dẫn rộng của công nghệ Runway.

Sự tham gia của Nvidia đặc biệt có ý nghĩa, vì nhà sản xuất chip này là nhà cung cấp hạ tầng tính toán quan trọng cho hầu hết các công ty AI. Việc Nvidia đầu tư vào Runway không chỉ cung cấp vốn mà còn có thể mang lại quyền truy cập vào phần cứng và chuyên môn kỹ thuật tiên tiến.

Gen 4.5 đang được triển khai dần dần, nhưng sẽ có sẵn cho tất cả khách hàng của Runway vào cuối tuần. Valenzuela cho biết đây là bản phát hành đầu tiên trong số nhiều bản phát hành lớn mà công ty dự trữ. Việc có một lộ trình sản phẩm mạnh mẽ là rất quan trọng trong không gian AI cạnh tranh cao độ, nơi các công ty phải liên tục đổi mới để duy trì vị thế.

Ông nói: "Nó sẽ có sẵn thông qua nền tảng của Runway, giao diện lập trình ứng dụng của nó và thông qua một số đối tác của công ty”. Chiến lược phân phối đa kênh này cho phép Runway tiếp cận nhiều phân khúc khách hàng khác nhau, từ người dùng cá nhân sử dụng nền tảng web đến các doanh nghiệp lớn tích hợp công nghệ qua API.

Thành công của Runway với Gen 4.5 có những hàm ý quan trọng cho ngành công nghiệp AI rộng hơn. Nó cho thấy rằng đổi mới đột phá không phải là đặc quyền của các gã khổng lồ công nghệ với ngân sách không giới hạn. Các công ty nhỏ hơn, tập trung và nhanh nhẹn có thể cạnh tranh hiệu quả bằng cách tập trung nguồn lực vào các lĩnh vực cụ thể và xây dựng chuyên môn sâu.

Điều này cũng nhấn mạnh tầm quan trọng của nghiên cứu cơ bản và cam kết dài hạn. Runway đã dành bảy năm phát triển công nghệ này, trong một ngành nơi nhiều công ty tìm kiếm kết quả nhanh chóng. Sự kiên nhẫn và tập trung này đã được đền đáp bằng một sản phẩm vượt trội trên thị trường.

Đối với ngành công nghiệp sáng tạo, sự xuất hiện của các công cụ tạo video AI mạnh mẽ như Gen 4.5 đại diện cho cả cơ hội và thách thức. Một mặt, những công cụ này có thể dân chủ hóa sản xuất video, cho phép các cá nhân và tổ chức nhỏ tạo ra nội dung chất lượng cao mà trước đây chỉ các hãng phim lớn mới có thể làm được. Mặt khác, chúng đặt ra câu hỏi về tương lai của công việc trong ngành sản xuất video truyền thống.

Runway dường như nhận thức được sự cân bằng tinh tế này, định vị sản phẩm của mình như một công cụ cho người sáng tạo thay vì thay thế cho họ. Bằng cách phục vụ các khách hàng như nhà thiết kế, người sáng tạo và sinh viên, công ty đang cố gắng trao quyền cho cộng đồng sáng tạo thay vì làm họ lỗi thời.

Khi cuộc đua AI tạo video tiếp tục nóng lên, thành công của Runway với Gen 4.5 đặt ra chuẩn mực mới cho ngành và chứng minh rằng sự đổi mới không phải lúc nào cũng đến từ những nơi có nhiều nguồn lực nhất.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/runway-ra-mo-hinh-video-vuot-mat-google-va-openai-241774.html