Công nghệ AI đang phát triển với tốc độ chóng mặt, và khả năng ứng dụng của nó cũng vậy. Một mặt, nguy cơ AI thay thế con người trong nhiều lĩnh vực đang hiện hữu, mặt khác, nó lại mở ra vô số cách thức để nâng tầm sáng tạo. Runway AI, một công ty công nghệ tại Mỹ, vừa giới thiệu mô hình AI video mới nhất của họ – Gen-3 Alpha. Theo Runway, đây là “bước tiến mới cho việc tạo video có độ chân thực cao và khả năng kiểm soát vượt trội”.
Gen-3 Alpha là mô hình đầu tiên trong loạt sản phẩm sắp ra mắt được Runway huấn luyện trên cơ sở hạ tầng mới, được xây dựng dành riêng cho việc đào tạo đa phương thức quy mô lớn. Runway khẳng định mô hình mới này là một bước nhảy vọt về độ trung thực, nhất quán và chuyển động so với Gen-2. Đây là nỗ lực của họ hướng tới việc xây dựng Mô hình Thế giới Tổng quát – bước tiến lớn tiếp theo của AI, cho phép hệ thống hiểu được thế giới trực quan và sự vận động của nó.
Kể từ khi ra mắt, Gen-3 Alpha đã tạo nên cơn sốt trong cộng đồng mạng với hàng loạt video độc đáo được chia sẻ. Những video độ phân giải cao này phô diễn sự linh hoạt và tiềm năng đáng kinh ngạc của mô hình AI mới từ Runway AI. Hãy cùng chiêm ngưỡng 9 video ấn tượng được tạo ra bởi Gen-3 Alpha:
1. Quái vật sông Thames: Người dùng Uncanny Harry AI trên X (trước đây là Twitter) đã sử dụng Gen-3 Alpha để tạo ra đoạn video ngắn về một con quái vật hư cấu trồi lên từ sông Thames ở London, gợi nhớ đến hình ảnh Godzilla hay Kaiju nổi tiếng. Đoạn phim 11 giây mang đậm chất điện ảnh với khung cảnh London u ám dưới bầu trời đầy mây, và con quái vật từ từ nhô lên khỏi những con sóng dữ dội.
2. Vẽ tranh chì tua nhanh thời gian: Anu Akash, một người dùng X tự nhận là “người khám phá các công cụ AI”, đã chia sẻ video tua nhanh thời gian về quá trình vẽ một cô gái bằng bút chì. Akash đã mô tả chi tiết yêu cầu của mình, bao gồm góc nhìn từ trên xuống và hình ảnh cô gái với mái tóc “giống tai thỏ” (do lỗi đánh máy). Mặc dù vậy, cô ấy tỏ ra rất hài lòng với kết quả mà Gen-3 Alpha mang lại.
3. Câu chuyện bằng hoa: Martin Haerlin, một người dùng X khác, đã sử dụng Gen-3 Alpha để tạo ra một vòng quay hình ảnh đầy mê hoặc về hoa. Người xem có thể thấy những cánh hoa hồng và đỏ bung nở trên bầu trời thành phố, súng bắn ra hoa đủ loại màu sắc và kích cỡ, cung tên của chiến binh biến thành hoa hướng dương, hoa cúc dại bay lơ lửng trong không trung, binh lính và võ sĩ điều khiển hoa. Haerlin chia sẻ rằng Gen-3 Alpha đã nâng tầm công cụ kể chuyện của anh lên một tầm cao mới.
4. Phim khoa học viễn tưởng: Bilawal Sidhu, cựu nhà phát triển AR/VR của Google Maps, đã sử dụng Gen-3 Alpha để hiện thực hóa ý tưởng khoa học viễn tưởng của mình. Anh đã đăng tải một loạt video trên tài khoản X của mình, ca ngợi mô hình AI này về khả năng mô phỏng hình ảnh hạt, hiệu ứng tương tác ánh sáng và chuyển động camera phức tạp. Sidhu cũng nhấn mạnh khả năng duy trì chi tiết tần số cao, tạo video theo phong cách game bắn súng góc nhìn thứ nhất và kiểm soát bằng lời nhắc văn bản của Gen-3 Alpha.
5. Điều khiển tốc độ camera bằng lời nhắc: vkuoo, một người đam mê nghệ thuật AI, đã chia sẻ video độc đáo cho thấy khả năng điều khiển tốc độ camera bằng lệnh văn bản của Gen-3 Alpha.
6. Siêu xe lướt qua màn đêm: Heather Cooper, một nhà giáo dục và tư vấn AI, đã chia sẻ video ngắn ấn tượng về một chiếc xe thể thao lướt qua mặt đường ướt. Video được quay ở góc thấp, cho thấy chiếc xe futuristic di chuyển qua con phố rực rỡ ánh đèn neon.
7. Chi tiết chân thực và lip sync hoàn hảo: Chrissie, một nhà sáng tạo video AI, đã chia sẻ video ngắn về một người phụ nữ đang đi bộ và nói về Gen-3 Alpha. Cô ấy ấn tượng với khả năng đồng bộ lip sync của mô hình AI này, đặc biệt là biểu cảm và cử chỉ của nhân vật.
8. Hình ảnh siêu thực: Nghệ sĩ kỹ thuật số và nhà làm phim Christopher Fryant đã chia sẻ bộ phim ngắn dài 53 giây có tên “This Town isn’t Real”, được tạo ra hoàn toàn bằng Gen-3 Alpha với một số chỉnh sửa và thiết kế âm thanh bổ sung. Video ghi lại cảnh máy quay lia qua khung cảnh ban đêm với dòng người di chuyển, tạo cảm giác như thật.
9. Du hành xuyên thời gian và không gian: Blaine Brown, một nhà lãnh đạo đổi mới, đã thử nghiệm Gen-3 Alpha lần đầu tiên với yêu cầu “Bay qua một lâu đài ở Ireland, sau đó biến thành thành phố cyberpunk tương lai với những tòa nhà chọc trời”. Video được tạo ra rất chi tiết, mô tả chính xác các tòa tháp góc, lối đi lát đá cuội của lâu đài và chuyển đổi mượt mà sang thành phố cyberpunk với những tòa nhà chọc trời lung linh.
Các mô hình video AI như Gen-3 Alpha là minh chứng cho tiềm năng to lớn của AI trong lĩnh vực truyền thông trực quan. Đầu năm nay, OpenAI đã gây chấn động thế giới với mô hình AI chuyển văn bản thành video vượt trội – Sora. Mặc dù Sora vẫn chưa được phát hành rộng rãi, nhưng dựa trên các video mẫu và những so sánh từ người dùng như Emad Mostaque, cựu CEO của Stability AI, Gen-3 Alpha dường như đang sánh ngang, thậm chí vượt trội hơn Sora ở một số khía cạnh.
Runway AI là một trong những công ty khởi nghiệp tiên phong trong lĩnh vực tạo video bằng AI. Gen-3 Alpha hiện đã được phát hành rộng rãi, cho phép người dùng tạo video AI siêu thực từ văn bản, hình ảnh hoặc thậm chí là video. Người dùng đã đăng ký nền tảng RunwayML có thể sử dụng mô hình này với mức phí từ 12 đô la mỗi tháng/người dùng.