Google lặng lẽ phát hành ứng dụng đọc chính tả AI ưu tiên ngoại tuyến trên iOS
Vào thứ Hai, Google đã lặng lẽ phát hành một ứng dụng đọc chính tả ưu tiên ngoại tuyến có tên "Google AI Edge Eloquent" trên iOS để cạnh tranh với các ứng dụng như Wispr Flow, SuperWhisper, Willow và những ứng dụng khác. Ứng dụng này được tải xuống miễn phí và sau khi các mô hình nhận dạng giọng nói tự động (ASR) dựa trên Gemma được tải xuống, bạn có thể bắt đầu đọc chính tả trên điện thoại của mình. Trong ứng dụng, bạn có thể thấy bản ghi trực tiếp và khi bạn nhấn tạm dừng, ứng dụng sẽ tự động lọc bỏ các từ đệm như "ừm" và "à" và trau chuốt văn bản. Bên dưới bản ghi là các tùy chọn như "Điểm chính", "Trang trọng", "Ngắn gọn" và "Dài dòng" để chuyển đổi văn bản.
Nguồn ảnh: Chụp màn hình bởi TechCrunch
Bạn cũng có thể tắt chế độ đám mây để chỉ sử dụng xử lý cục bộ. (Khi bật chế độ đám mây, ứng dụng sẽ sử dụng các mô hình Gemini dựa trên đám mây để làm sạch văn bản.) Google AI Edge Eloquent có thể nhập một số từ khóa, tên và biệt ngữ nhất định từ tài khoản Gmail của bạn, nếu muốn. Ngoài ra, bạn có thể thêm các từ tùy chỉnh của riêng mình vào danh sách. Ứng dụng hiển thị lịch sử của phiên ghi âm và cho phép bạn tìm kiếm tất cả các phiên đó. Nó có thể hiển thị cho bạn các từ được đọc trong phiên cuối cùng, tốc độ từ mỗi phút của bạn và tổng số từ đã nói.
“Google AI Edge Eloquent là một ứng dụng đọc chính tả tiên tiến được thiết kế để thu hẹp khoảng cách giữa lời nói tự nhiên và văn bản chuyên nghiệp, sẵn sàng sử dụng. Không giống như phần mềm đọc chính tả tiêu chuẩn ghi lại những vấp váp và từ đệm một cách nguyên văn, Eloquent sử dụng AI để nắm bắt ý định của bạn. Nó tự động loại bỏ 'ừm', 'à' và các chỉnh sửa giữa câu, đưa ra văn xuôi sạch sẽ, chính xác,” mô tả trên App Store của công ty cho biết.
Tôi đang nói "Ghi âm". Ứng dụng này vẫn còn trong giai đoạn đầu.
Nguồn ảnh: TechCrunch
Mặc dù ứng dụng hiện chỉ khả dụng trên iOS, nhưng mô tả trên App Store có đề cập đến phiên bản Android. (Chúng tôi đã liên hệ với Google để biết thêm thông tin và sẽ cập nhật câu chuyện nếu chúng tôi nhận được phản hồi.) Theo mô tả, Eloquent cung cấp "tích hợp Android liền mạch", nơi nó có thể được đặt làm bàn phím mặc định của người dùng để truy cập trên toàn hệ thống trên bất kỳ trường văn bản nào. Ngoài ra, ứng dụng sẽ có thể sử dụng tính năng nút nổi, tương tự như tính năng mà Wispr Flow sử dụng trên Android, để dễ dàng truy cập vào phiên âm từ mọi nơi.
Các ứng dụng phiên âm được hỗ trợ bởi AI đang ngày càng trở nên phổ biến đối với người dùng khi các mô hình chuyển giọng nói thành văn bản ngày càng tốt hơn. Với ứng dụng thử nghiệm này, Google đang tham gia vào xu hướng này. Nếu thử nghiệm này thành công, chúng ta có thể thấy các tính năng phiên âm được cải thiện trên Android.
Ivan phụ trách các phát triển công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy có trụ sở tại Ấn Độ và trước đây đã làm việc tại các ấn phẩm bao gồm Huffington Post và The Next Web. Bạn có thể liên hệ hoặc xác minh thông tin liên lạc từ Ivan bằng cách gửi email tới im@ivanmehta.com hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal.
Góc nhìn từ cộng đồng
Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.