Adobe Firefly AI cách mạng hóa nhạc nền và lồng tiếng video

Adobe đang mang đến những công cụ AI tạo sinh âm thanh mới, hứa hẹn thay đổi cách các nhà làm phim và nhà sáng tạo nội dung thêm nhạc nền và lồng tiếng cho video. Các tính năng như Generate Soundtrack và Generate Speech đang được giới thiệu trong ứng dụng Adobe Firefly AI đã được thiết kế lại, đồng thời Adobe cũng phát triển một công cụ sản xuất video nền web mới, kết hợp nhiều tính năng AI với một dòng thời gian chỉnh sửa đơn giản.

Công cụ Generate Soundtrack hiện đang ra mắt phiên bản beta công khai trong ứng dụng Firefly. Nó hoạt động bằng cách phân tích video tải lên, sau đó tạo ra một loạt các bản nhạc nền không lời tự động đồng bộ hóa với cảnh quay. Người dùng có thể định hướng phong cách âm nhạc bằng cách chọn từ các cài đặt sẵn như lofi, hip-hop, classical, EDM, hoặc mô tả cảm xúc mong muốn qua giao diện nhập liệu văn bản, ví dụ như “tình cảm hơn” hay “mạnh mẽ hơn”. Công cụ này cũng sẽ đề xuất một gợi ý ban đầu dựa trên nội dung video được tải lên.

Alexandru Costin, người đứng đầu mảng AI tạo sinh của Adobe, chia sẻ rằng họ muốn giúp người dùng dễ dàng tạo nhạc, xem đây là một “cơ bắp” mới cần phát triển. Vì vậy, khi bạn cung cấp một clip, hệ thống sẽ dự đoán loại nhạc phù hợp, đồng thời cung cấp phương pháp “Mad Libs” cho phép bạn chọn cảm xúc, phong cách và mục tiêu của clip. Generate Soundtrack sẽ cung cấp bốn biến thể âm thanh riêng biệt cho mỗi yêu cầu, với mỗi clip có độ dài tối đa năm phút.

Mô hình AI Firefly mà Generate Soundtrack được xây dựng dựa trên đã được đào tạo bằng nội dung có bản quyền. Điều này đảm bảo rằng các nhà sáng tạo sẽ không phải lo lắng về việc video của họ bị gỡ xuống do vi phạm bản quyền. Adobe khẳng định đã mua nhạc và giọng nói từ các chủ sở hữu quyền sở hữu trí tuệ, do đó có thể tự tin cung cấp sản phẩm này an toàn thương mại. Lời cam kết này giúp các nỗ lực tạo nhạc bằng AI của Adobe có lợi thế hơn so với các đối thủ như Suno và Udio, vốn đã bị kiện về vi phạm bản quyền và thừa nhận đào tạo mô hình AI của họ trên các tài liệu được bảo vệ.

Bên cạnh đó, công cụ Generate Speech của Firefly cũng đang ra mắt phiên bản beta công khai, cho phép tạo lồng tiếng cho các dự án video từ văn bản. Nó cung cấp hơn 50 giọng nói được hỗ trợ bởi Firefly Speech Model của Adobe hoặc ElevenLabs, với sự hỗ trợ cho hơn 20 ngôn ngữ. Người dùng có thể tinh chỉnh các yếu tố như tốc độ, cao độ, cảm xúc và tự sửa lỗi phát âm cho các tên riêng hoặc từ ngữ có thể có biến thể vùng miền.

Một công cụ làm phim khác đang được phát triển là Firefly video editor, được Adobe mô tả là một “trình chỉnh sửa dòng thời gian đa kênh để tạo, sắp xếp, cắt và sắp xếp các clip”. Ứng dụng này kết hợp các công cụ tạo lồng tiếng, nhạc nền và tiêu đề của Adobe vào một ứng dụng nền web duy nhất, cùng với các tính năng chỉnh sửa từng khung hình và cài đặt phong cách sẵn có. Firefly video editor sẽ bắt đầu triển khai phiên bản beta riêng tư vào tháng tới, với những người dùng tiềm năng cần đăng ký vào danh sách chờ để được truy cập sớm.

Những công cụ AI mới của Adobe không chỉ đơn thuần là cải tiến công nghệ, mà còn là một bước tiến quan trọng giúp các nhà sáng tạo nội dung tối ưu hóa quy trình làm việc, tiết kiệm thời gian và đảm bảo sự an toàn về bản quyền. Khả năng tạo nhạc nền tự động và lồng tiếng video chất lượng cao, cùng với sự tích hợp vào một nền tảng chỉnh sửa video hoàn chỉnh, sẽ mở ra nhiều cánh cửa sáng tạo và nâng cao hiệu quả sản xuất. Chúng tôi khuyến khích các nhà làm phim và nhà sáng tạo nội dung khám phá những tính năng đột phá này để nâng tầm chất lượng sản phẩm của mình.

vMixMC