Google ra mắt ứng dụng ai edge eloquent hỗ trợ chuyển giọng nói thành văn bản offline

Google vừa âm thầm phát hành Google AI Edge Eloquent trên nền tảng iOS, đánh dấu bước tiến mới trong việc cung cấp công cụ soạn thảo bằng giọng nói ưu tiên tính năng ngoại tuyến. Ứng dụng này được thiết kế để cạnh tranh trực tiếp với các đối thủ như Wispr Flow hay SuperWhisper bằng cách tận dụng các mô hình nhận dạng giọng nói tự động (ASR) dựa trên Gemma. Người dùng chỉ cần tải xuống bộ dữ liệu mô hình một lần duy nhất để có thể thực hiện việc chuyển đổi âm thanh thành văn bản ngay trên thiết bị mà không cần kết nối internet.

Điểm khác biệt của Eloquent so với các phần mềm đọc chép thông thường nằm ở khả năng xử lý thông minh. Thay vì ghi lại chính xác từng từ ngữ thừa hay các lỗi phát âm, ứng dụng tự động loại bỏ các từ đệm như “ừm”, “à” và tinh chỉnh văn bản ngay khi người dùng tạm dừng. Kết quả đầu ra không chỉ là một bản ghi chép thô mà là một đoạn văn bản chuyên nghiệp, mạch lạc và đúng trọng tâm ý định của người nói nhờ khả năng tự sửa lỗi ngay giữa câu.

Sau khi hoàn tất quá trình chuyển ngữ, người dùng có thể tùy chỉnh định dạng văn bản thông qua các tùy chọn như Key points (ý chính), Formal (trang trọng), Short (ngắn gọn) hoặc Long (chi tiết). Để tăng độ chính xác cho các thuật ngữ chuyên ngành, Eloquent cho phép nhập danh sách từ khóa, tên riêng từ tài khoản Gmail hoặc thêm các từ ngữ cá nhân hóa theo nhu cầu. Mọi phiên làm việc đều được lưu trữ trong lịch sử, hỗ trợ tìm kiếm nhanh và cung cấp các chỉ số thống kê như tốc độ nói (words-per-minute) hay tổng số từ đã thực hiện.

Vấn đề quyền riêng tư được Google chú trọng khi cho phép người dùng tắt hoàn toàn chế độ đám mây để xử lý dữ liệu cục bộ. Khi bật chế độ đám mây, ứng dụng sẽ sử dụng các mô hình Gemini để tối ưu hóa việc làm sạch và biên tập văn bản ở mức độ cao hơn. Sự linh hoạt này giúp người dùng chủ động lựa chọn giữa hiệu suất xử lý tối đa và bảo mật thông tin tuyệt đối tùy theo tính chất của công việc và yêu cầu về an toàn dữ liệu.

Mặc dù hiện tại mới chỉ xuất hiện trên App Store, các mô tả sản phẩm đã hé lộ về một phiên bản dành cho Android với khả năng tích hợp sâu hơn vào hệ thống. Dự kiến, ứng dụng trên Android có thể được thiết lập làm bàn phím mặc định hoặc sử dụng nút nổi để hỗ trợ nhập liệu bằng giọng nói trong bất kỳ trường văn bản nào. Đây là một phần trong thử nghiệm của Google nhằm cải thiện trải nghiệm người dùng trước khi triển khai rộng rãi các tính năng AI tiên tiến này lên hệ sinh thái di động toàn cầu.

Sự xuất hiện của Google AI Edge Eloquent cho thấy xu hướng đưa trí tuệ nhân tạo trực tiếp xuống thiết bị đầu cuối đang ngày càng trở nên phổ biến và thực dụng. Nếu bạn thường xuyên phải xử lý các ghi chú dài hoặc cần một công cụ soạn thảo văn bản nhanh chóng khi đang di chuyển, việc trải nghiệm ứng dụng này sẽ mang lại hiệu quả công việc rõ rệt. Hãy thử tải xuống và thiết lập các mô hình ngoại tuyến để cảm nhận sự khác biệt trong cách công nghệ hỗ trợ tối ưu hóa tư duy ngôn ngữ của bạn.

Chia sẻ tới bạn bè và gia đình
Gọi ngay Chat