Việc huy động vốn lớn đang mở ra nhiều cơ hội cho các nhà nghiên cứu AI có ý tưởng đột phá, đặc biệt khi họ muốn phát triển độc lập thay vì trong các phòng thí nghiệm lớn. Đây chính là câu chuyện của Inception, một startup đang phát triển các mô hình AI dựa trên khuếch tán và vừa gọi thành công 50 triệu USD trong vòng hạt giống. Khoản đầu tư này được dẫn dắt bởi Menlo Ventures, cùng sự tham gia của các quỹ lớn như Mayfield, Innovation Endeavors, NVentures của Nvidia, M12 của Microsoft, Snowflake Ventures và Databricks Investment. Bên cạnh đó, các chuyên gia hàng đầu như Andrew Ng và Andrej Karpathy cũng đóng góp vốn thiên thần.
Dự án Inception được dẫn dắt bởi giáo sư Stefano Ermon từ Đại học Stanford, người có nghiên cứu chuyên sâu về các mô hình khuếch tán. Những mô hình này tạo ra kết quả thông qua quá trình tinh chỉnh lặp đi lặp lại thay vì sinh từng từ một, và chúng là nền tảng của các hệ thống AI tạo ảnh nổi tiếng như Stable Diffusion, Midjourney và Sora. Với kinh nghiệm làm việc trên các hệ thống này từ trước khi bùng nổ AI, giáo sư Ermon đang áp dụng cùng một phương pháp khuếch tán cho một loạt nhiệm vụ rộng hơn tại Inception.
Cùng với việc công bố khoản tài trợ, công ty đã ra mắt phiên bản mới của mô hình Mercury, được thiết kế đặc biệt cho phát triển phần mềm. Mercury đã được tích hợp vào một số công cụ phát triển như ProxyAI, Buildglare và Kilo Code. Giáo sư Ermon nhấn mạnh rằng phương pháp khuếch tán sẽ giúp các mô hình của Inception tiết kiệm đáng kể hai chỉ số quan trọng nhất: độ trễ (thời gian phản hồi) và chi phí tính toán. Ông khẳng định, “Các LLM dựa trên khuếch tán này nhanh hơn và hiệu quả hơn rất nhiều so với những gì mọi người đang xây dựng hiện nay. Đây là một cách tiếp cận hoàn toàn khác biệt, nơi vẫn còn rất nhiều đổi mới có thể mang lại.”
Để hiểu rõ sự khác biệt kỹ thuật, cần biết rằng các mô hình khuếch tán có cấu trúc khác biệt so với mô hình tự hồi quy (auto-regression models) đang thống trị các dịch vụ AI dựa trên văn bản. Các mô hình tự hồi quy như GPT-5 và Gemini hoạt động tuần tự, dự đoán từng từ hoặc đoạn từ tiếp theo dựa trên tài liệu đã xử lý trước đó. Ngược lại, mô hình khuếch tán, vốn được đào tạo để tạo ảnh, áp dụng một phương pháp toàn diện hơn, điều chỉnh cấu trúc tổng thể của phản hồi một cách gia tăng cho đến khi nó khớp với kết quả mong muốn.
Mặc dù quan điểm thông thường là sử dụng mô hình tự hồi quy cho các ứng dụng văn bản và phương pháp này đã rất thành công, nhưng ngày càng có nhiều nghiên cứu cho thấy mô hình khuếch tán có thể hoạt động tốt hơn khi xử lý lượng lớn văn bản hoặc trong điều kiện hạn chế dữ liệu. Giáo sư Ermon cho biết, những đặc tính này trở thành lợi thế thực sự khi thực hiện các hoạt động trên các cơ sở mã lớn. Các mô hình khuếch tán cũng linh hoạt hơn trong cách sử dụng phần cứng, một ưu điểm đặc biệt quan trọng khi nhu cầu về hạ tầng AI ngày càng rõ ràng. Trong khi các mô hình tự hồi quy phải thực hiện các phép toán lần lượt, mô hình khuếch tán có thể xử lý nhiều phép toán đồng thời, cho phép giảm đáng kể độ trễ trong các tác vụ phức tạp. Ông chia sẻ: “Chúng tôi đã được đánh giá ở mức hơn 1.000 token mỗi giây, cao hơn nhiều so với bất kỳ công nghệ tự hồi quy hiện có nào, vì hệ thống của chúng tôi được xây dựng để xử lý song song, cực kỳ nhanh chóng.”
Với khoản đầu tư đáng kể và cách tiếp cận đột phá, Inception đang định hình lại cách chúng ta nghĩ về AI trong lĩnh vực mã và văn bản. Việc ứng dụng mô hình khuếch tán không chỉ hứa hẹn mang lại hiệu suất vượt trội và chi phí tối ưu, mà còn mở ra những tiềm năng mới cho các nhà phát triển và doanh nghiệp đang tìm kiếm giải pháp AI hiệu quả cho các tác vụ phức tạp. Theo dõi Inception có thể là một cách để chứng kiến tương lai của AI đang được định hình.

