Multiverse Computing vừa công bố hai mô hình AI mới: SuperFly và ChickBrain, với kích thước nhỏ gọn nhưng hiệu suất ấn tượng. Được phát triển dựa trên công nghệ CompactifAI, các mô hình này có khả năng vận hành hiệu quả trên nhiều thiết bị, từ IoT đến smartphone. Điều đáng chú ý là cách tiếp cận mới này không chỉ giảm thiểu dung lượng mà còn duy trì chất lượng xử lý, mở ra nhiều khả năng ứng dụng thực tiễn trong tương lai gần.
Những điểm chính
- Multiverse Computing giới thiệu hai mô hình AI nhỏ gọn: SuperFly (94 triệu tham số) và ChickBrain (3,2 tỷ tham số) hiệu suất cao.
- Các mô hình được thiết kế để hoạt động hiệu quả trên thiết bị IoT, smartphone và PC, không cần kết nối internet.
- Công nghệ nén mô hình “CompactifAI” giúp giảm kích thước mà không làm mất hiệu suất xử lý.
- ChickBrain vượt trội trong các bài kiểm tra benchmark như MMLU-Pro, Math 500 và GSM8K so với mô hình gốc.
- Multiverse hợp tác với các nhà sản xuất lớn như HP, Apple và Samsung, cung cấp mô hình AI qua API trên nền tảng AWS.
Mặc dù mới thành lập từ năm 2019, Multiverse Computing đã nhanh chóng khẳng định vị thế với những AI models nhỏ gọn nhưng hiệu suất cao, phù hợp cho thiết bị IoT, smartphone và PC. Công ty châu Âu có trụ sở tại Donostia, Tây Ban Nha, được đồng sáng lập bởi Román Orús, Samuel Mugel và Enrique Lizaso Olmos. Gần đây, họ đã huy động thành công 189 triệu euro, nâng tổng số vốn đầu tư lên khoảng 250 triệu đô la kể từ khi thành lập. Multiverse tập trung phát triển các mô hình AI có kích thước tối ưu nhưng vẫn đảm bảo hiệu suất mạnh mẽ, đáp ứng nhu cầu đa dạng trên nhiều thiết bị khác nhau.
Gần đây, Multiverse ra mắt hai mô hình mới là SuperFly và ChickBrain. SuperFly với 94 triệu tham số được ví như bộ não ruồi, còn ChickBrain sở hữu 3,2 tỷ tham số tương đương bộ não gà. Cả hai đều được thiết kế để hoạt động hiệu quả trên các thiết bị như IoT, smartphone, máy tính bảng và PC, thậm chí có thể vận hành mà không cần kết nối internet. Điểm nổi bật là khả năng ứng dụng rộng rãi trong các trường hợp cần xử lý dữ liệu ở biên hoặc trong môi trường hạn chế băng thông.
Multiverse áp dụng công nghệ nén mô hình lấy cảm hứng từ lượng tử mang tên “CompactifAI”. Thuật toán này giúp giảm kích thước mô hình mà không làm giảm hiệu suất, khác biệt rõ rệt so với các phương pháp nén truyền thống trong khoa học máy tính. Đây là nền tảng để công ty tạo ra những mô hình nhỏ nhất nhưng vẫn giữ được sức mạnh xử lý vượt trội. Họ cũng đã phát hành các phiên bản nén của các mô hình mã nguồn mở phổ biến, mở rộng khả năng ứng dụng của công nghệ.
Về mặt hiệu năng, ChickBrain vượt trội hơn các mô hình gốc trong nhiều bài kiểm tra benchmark như MMLU-Pro, Math 500, GSM8K và GPQA Diamond. Trong khi đó, SuperFly được thiết kế dành cho các ứng dụng cần đào tạo với dữ liệu hạn chế, đặc biệt phù hợp với các thiết bị điều khiển bằng giọng nói trong các thiết bị gia dụng. Công ty nhấn mạnh rằng Model Zoo của họ không nhằm mục đích cạnh tranh trực tiếp với các mô hình lớn trên các benchmark thông thường mà tập trung vào các trường hợp sử dụng thực tế và hiệu quả cho thiết bị biên.
Ngoài ra, Multiverse đang trong quá trình đàm phán với nhiều nhà sản xuất thiết bị hàng đầu như Apple, Samsung, Sony và HP, trong đó HP cũng là nhà đầu tư vòng gọi vốn gần đây. Công ty cung cấp công nghệ nén không chỉ cho các mô hình AI mà còn mở rộng sang các ứng dụng học máy khác như nhận dạng hình ảnh. Danh sách khách hàng của họ gồm các tập đoàn lớn như BASF, Ally, Moody’s và Bosch. Các mô hình được cung cấp qua API trên nền tảng AWS với mức phí token cạnh tranh, thuận tiện cho các nhà phát triển tích hợp vào sản phẩm của mình.

