Mô hình ngôn ngữ LLaMA của Facebook đã bị rò rỉ, và tải lên GitHub

Meta cho biết đã phát hành mô hình ngôn ngữ mới tên LLaMA cho các nhà nghiên cứu. Mô hình này làm nóng cuộc đua siêu AI khi các công ty công nghệ lớn đều đang không thể đứng ngoài xu hướng trí tuệ nhân tạo. LLaMA được viết tắt từ Large Language Model Meta AI (Mô hình Ngôn ngữ Lớn về AI của Meta). Nó hoạt động dưới dạng mở, cho phép các nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.

Gần đây, toàn bộ mô hình LLaMA đã bị rò rỉ, và tải lên GitHub, giúp nó dễ dàng có sẵn cho bất cứ ai tải về và sử dụng.

Một người dùng nói đã chạy LLaMA-65B trên một chiếc máy với GPU  A100 80GB với 8bit quantization và ghi nhận rằng đầu ra có thể so sánh với Davinci của GPT-3.5.