'ByteDance mất 6 tháng để thực hiện các dự án mà startup có thể hoàn thành trong 1 tháng'
Liang Rubo, Giám đốc điều hành ByteDance (chủ sở hữu TikTok), đã cảnh báo các nhân viên tại cuộc họp toàn công ty rằng họ có nguy cơ trở nên tự mãn và rơi vào tình trạng tầm thường khi phải đối mặt với những thách thức từ các startup (công ty khởi nghiệp) mới hơn.
Tại một cuộc họp ở Singapore với sự theo dõi của các nhân viên trên toàn thế giới, Liang Rubo cho biết việc mở rộng nhanh chóng của ByteDance những năm gần đây khiến công ty hoạt động kém hiệu quả hơn. Liang Rubo nói ByteDance chưa quan tâm đúng mức đến công nghệ trí tuệ nhân tạo (AI), theo một bài đăng của công ty về cuộc họp trên mạng xã hội.
“Công ty chúng tôi không đủ nhạy bén với các công nghệ mới. Ví dụ các cuộc thảo luận về GPT đã không xuất hiện trong bài đánh giá công nghệ kéo dài nửa năm của chúng tôi cho đến 2023, dù GPT-1 đã được phát hành vào 2018", Liang Rubo nhấn mạnh.
GPT (Generative Pre-trained Transformer) là mô hình học máy sử dụng kiến trúc Transformer trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Mô hình này được phát triển bởi OpenAI, công ty khởi nghiệp tạo ra ChatGPT.
GPT có khả năng tạo ra văn bản mới một cách tự động và sáng tạo sau khi được huấn luyện trên lượng lớn dữ liệu ngôn ngữ từ internet. Nó không chỉ có khả năng sinh ra văn bản, mà còn có thể thực hiện nhiều nhiệm vụ xử lý ngôn ngữ tự nhiên khác nhau như dịch ngôn ngữ, tóm tắt văn bản, trả lời câu hỏi cùng nhiều ứng dụng khác. GPT-4 và GPT-4 Turbo là những phiên bản mô hình ngôn ngữ lớn mới nhất của OpenAI.
ByteDance thường được coi là công ty hàng đầu thế giới về thuật toán vì các ứng dụng nổi tiếng nhất của họ như TikTok, Douyin và Toutiao được hỗ trợ bởi những hệ thống đề xuất mạnh mẽ.
Thế nhưng, ByteDance, tập đoàn Trung Quốc có biệt danh là App Factory do thường xuyên phát hành các ứng dụng di động, đã chậm chân trong cuộc đua AI đang làm đảo lộn ngành công nghệ.
Các tỷ phú công nghệ Trung Quốc khác như Richard Liu (người sáng lập JD.com) và Ma Huateng (Chủ tịch Tencent) đang kêu gọi công ty của họ hoạt động trở nên hiệu quả hơn và tránh tự mãn.
Nhấn mạnh sự khởi đầu muộn màng của ByteDance trên các mô hình nền tảng AI, Liang Rubo cho biết các công ty có mô hình tốt hơn đã tạo ra chúng từ năm 2018 đến 2021.
Ông nói: “Với nhiều đội ngũ khởi nghiệp giỏi, họ rất quen thuộc với ngành này. Họ có thể nhanh chóng phát hiện bất kỳ dự án mới nào xuất hiện trên GitHub và sau đó họ bắt đầu tìm kiếm cơ hội mua lại hoặc hợp tác”.
“
GitHub là dịch vụ lưu trữ mã nguồn dựa trên nền web cho các dự án phát triển phần mềm, cung cấp cả phiên bản trả tiền lẫn miễn phí cho các tài khoản. Các dự án mã nguồn mở sẽ được cung cấp kho lưu trữ miễn phí. GitHub là một nền tảng phổ biến cho cộng đồng phát triển phần mềm, được sử dụng bởi các cá nhân, doanh nghiệp và tổ chức từ khắp nơi trên thế giới.
Thành lập vào năm 2008 bởi Tom Preston-Werner, Chris Wanstrath, P. J. Hyett cùng Scott Chacon, GitHub được Microsoft mua lại vào năm 2018 với giá 7,5 tỉ USD.
Liang Rubo nói thêm rằng ByteDance đang gặp phải quá nhiều vấn đề quan liêu nội bộ khi tập đoàn mở rộng, hiện phải mất 6 tháng để thực hiện các dự án mà một công ty khởi nghiệp có thể hoàn thành trong 1 tháng.
ByteDance gần đây đã tăng cường tập trung vào AI, đồng thời rút lui khỏi một số hoạt động kinh doanh như game. Tập đoàn đã thử nghiệm một số chatbot AI như Doubao ở Trung Quốc cùng Cici và ChitChop tại nước ngoài.
Chiến lược AI của ByteDance đã bị giám sát chặt chẽ vào tháng trước sau khi hãng tin công nghệ The Verge (Mỹ) cho biết tập đoàn Trung Quốc sử dụng công nghệ từ OpenAI để phát triển AI riêng. ByteDance phản hồi rằng việc sử dụng công nghệ từ OpenAI để hỗ trợ phát triển mô hình trí AI riêng tuân thủ các điều khoản dịch vụ của công ty Mỹ.
Theo The Verge, ByteDance đang phát triển dự án AI Project Seed, gồm hai sản phẩm chính là Doubao và một chatbot AI khác để thương mại hóa trên toàn cầu thông qua nền tảng đám mây. Cách phân bổ này tương tự khi tập đoàn Trung Quốc phát hành ứng dụng video ngắn Douyin và TikTok. Tuy nhiên theo The Verge, thay vì sử dụng công cụ huấn luyện AI theo mô hình ngôn ngữ lớn riêng, ByteDance được cho dùng giao diện lập trình ứng dụng (API) của OpenAI, vi phạm quy định trong ngành AI.
The Verge đưa tin ByteDance lạm dụng công cụ của OpenAI trong nhiều giai đoạn phát triển Project Seed, gồm công đoạn đào tạo và đánh giá mô hình AI. Song khi cần xin cấp phép hoạt động chatbot Doubao tại Trung Quốc vài tháng trước, ByteDance yêu cầu nhóm nghiên cứu dừng sử dụng API OpenAI để tránh rắc rối pháp lý.
Theo The Verge, Project Seed được khởi động hơn một năm trước và nhận được sự ưu tiên từ lãnh đạo ByteDance. Mục tiêu của dự án là tạo một mô hình ngôn ngữ lớn mạnh mẽ trong thời gian tối thiểu. Dự kiến mô hình AI này đạt 200 tỉ tham số cuối năm 2023, vượt qua mốc 175 tỉ của GPT-3.5, đồng thời đuổi kịp GPT-4 vào năm 2024.
ByteDance đã đưa ra lời giải thích sau khi bị The Verge cáo buộc lén lút sử dụng công nghệ của OpenAI để phát triển mô hình ngôn ngữ lớn riêng, đồng thời cố gắng che giấu dấu vết của mình thông qua “giảm dữ liệu nhạy cảm”.
Trong một tuyên bố với trang SCMP, ByteDance thừa nhận rằng khi bắt đầu khám phá mô hình ngôn ngữ lớn vào đầu năm 2023, nhóm nhỏ kỹ sư của họ đã sử dụng dịch vụ API từ OpenAI trong một mô hình thử nghiệm chưa bao giờ được ra mắt công khai.
Công ty mẹ TikTok nói thêm rằng công việc ban đầu này đã bị ngừng vào tháng 4.2023, sau khi giới thiệu một giao thức nhằm đảm bảo tuân thủ các điều khoản sử dụng của OpenAI, trong đó cấm sử dụng đầu ra từ các sản phẩm GPT của công ty Mỹ để “phát triển các mô hình cạnh tranh với OpenAI”.
Theo ByteDance (có trụ sở tại Bắc Kinh, thủ đô Trung Quốc), nhóm kỹ thuật của họ vẫn sử dụng API từ OpenAI cùng với một số mô hình bên thứ ba khác “ở một mức độ rất hạn chế trong quá trình đánh giá/thử nghiệm, chẳng hạn như đo điểm chuẩn”.
“ByteDance được cấp phép sử dụng API OpenAI và rất chú trọng đến việc tuân thủ các điều khoản sử dụng của OpenAI”, tập đoàn Trung Quốc cho biết.
Trước đó, Jodi Seth (đại diện ByteDance) xác nhận tập đoàn có dùng API của OpenAI trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm 2023.
"Công ty được Microsoft cấp phép truy cập API OpenAI. Ngoài ra, ByteDance chỉ sử dụng công cụ này để hỗ trợ sản phẩm AI ở thị trường quốc tế. Với chatbot Doubao tại Trung Quốc, chúng tôi có các mô hình tự phát triển", Jodi Seth nói.
Tuy nhiên, OpenAI thông báo đã đình chỉ ByteDance truy cập vào dịch vụ của mình.
“Dù việc sử dụng API của chúng tôi ở mức tối thiểu nhưng ByteDance đã bị đình chỉ tài khoản của họ trong khi điều tra thêm. Nếu phát hiện ra rằng việc sử dụng của ByteDance không tuân theo các chính sách này, chúng tôi sẽ yêu cầu thực hiện những thay đổi cần thiết hoặc chấm dứt tài khoản của họ”, OpenAI cho biết trong một tuyên bố gửi tới The Verge.
OpenAI, công ty khởi nghiệp được Microsoft hậu thuẫn, chưa được chính thức cung cấp dịch vụ của mình ở Trung Quốc.
Việc cáo buộc ByteDance sử dụng công nghệ của OpenAI để xây dựng mô hình ngôn ngữ lớn riêng đến sau khi công ty khởi nghiệp 01.AI và bị tố sao chép kiến trúc Llama của Meta Platforms trong mô hình Yi-34B LLM của mình, theo một bài đăng trên cộng đồng mã nguồn mở Huggingface.
01.AI được Lý Khải Phục, chuyên gia AI và cựu Chủ tịch Google Trung Quốc, thành lập.