DeepL mở rộng dịch vụ sang dịch giọng nói thời gian thực

DeepL, nổi tiếng với dịch văn bản, giờ muốn dịch cả giọng nói của bạn

DeepL, một công ty dịch thuật nổi tiếng với các công cụ dịch văn bản, hôm nay đã ra mắt bộ công cụ dịch giọng nói sang giọng nói, phục vụ các trường hợp sử dụng như cuộc họp, cuộc trò chuyện trên điện thoại và web, và cuộc trò chuyện nhóm cho nhân viên tuyến đầu thông qua các ứng dụng tùy chỉnh. Công ty cũng phát hành một API cho phép các nhà phát triển và doanh nghiệp bên ngoài xây dựng dựa trên công nghệ của DeepL cho các trường hợp sử dụng tùy chỉnh, chẳng hạn như trung tâm cuộc gọi.

“Sau nhiều năm hoạt động trong lĩnh vực dịch văn bản, dịch giọng nói là một bước tiến tự nhiên đối với chúng tôi,” CEO Jarek Kutylowski của DeepL nói với TechCrunch trong một cuộc phỏng vấn. “Chúng tôi đã đạt được những tiến bộ lớn trong lĩnh vực dịch văn bản và dịch tài liệu. Nhưng chúng tôi nghĩ rằng không có sản phẩm tuyệt vời nào cho dịch giọng nói theo thời gian thực.”

Kutylowski cho biết những thách thức trong việc tạo ra một sản phẩm dịch thuật theo thời gian thực tập trung vào việc cân bằng giữa giảm độ trễ — độ trễ giữa thời điểm ai đó nói và âm thanh được dịch phát lại — và duy trì kết quả chính xác.

DeepL đang phát hành các tiện ích bổ sung cho các nền tảng như Zoom và Microsoft Teams, nơi người nghe có thể nghe bản dịch theo thời gian thực trong khi những người khác đang nói bằng ngôn ngữ mẹ đẻ hoặc theo dõi văn bản được dịch theo thời gian thực trên màn hình. Chương trình này hiện đang trong giai đoạn truy cập sớm và công ty đang mời các tổ chức tham gia danh sách chờ.

Công ty cũng có một sản phẩm cho các cuộc trò chuyện trên điện thoại và web có thể diễn ra trực tiếp hoặc từ xa. DeepL cũng cho phép người dùng tham gia vào cuộc trò chuyện nhóm trong các cài đặt như các buổi đào tạo hoặc hội thảo, cho phép người tham gia tham gia thông qua mã QR.

DeepL cho biết công nghệ giọng nói sang giọng nói của họ cũng có thể học và thích ứng với từ vựng tùy chỉnh, chẳng hạn như các thuật ngữ dành riêng cho ngành và tên công ty và cá nhân.

Kutylowski cho biết AI đang định hình lại dịch vụ khách hàng sẽ như thế nào trong những năm tới. Ông lưu ý rằng một lớp dịch thuật giúp các công ty cung cấp hỗ trợ bằng các ngôn ngữ mà đội ngũ nhân viên đủ tiêu chuẩn khan hiếm và tốn kém để thuê.

Sự kiện Techcrunch San Francisco, CA | 13-15 tháng 10 năm 2026

Công ty cho biết họ kiểm soát toàn bộ ngăn xếp giọng nói sang giọng nói. Tuy nhiên, hệ thống hiện tại chuyển đổi giọng nói thành văn bản, áp dụng bản dịch, sau đó chuyển đổi lại thành giọng nói. DeepL tin rằng vì họ đã làm việc trên dịch văn bản trong nhiều năm, họ có lợi thế về chất lượng dịch thuật. Trong tương lai, công ty muốn phát triển một mô hình dịch giọng nói đầu cuối bỏ qua hoàn toàn bước văn bản.

DeepL phải đối mặt với sự cạnh tranh từ một số công ty khởi nghiệp được tài trợ tốt đang làm việc trong các lĩnh vực lân cận của không gian này. Sanas, công ty đã huy động được 65 triệu đô la từ Quadrille Capital và Teleperformance vào năm ngoái, sử dụng AI để sửa đổi giọng của người nói trong thời gian thực — một công cụ chủ yếu nhắm vào các nhân viên trung tâm cuộc gọi. Camb.AI có trụ sở tại Dubai tập trung vào tổng hợp và dịch giọng nói cho các công ty truyền thông và giải trí Amazon Web Services, giúp họ lồng tiếng và bản địa hóa nội dung video trên quy mô lớn. Palabra, được hỗ trợ bởi công ty Seven Seven Six của đồng sáng lập Reddit Alexis Ohanian, đang xây dựng một công cụ dịch giọng nói theo thời gian thực được thiết kế để bảo tồn cả ý nghĩa và giọng nói gốc của người nói, đưa nó vào sự cạnh tranh trực tiếp hơn với những gì DeepL hiện đang xây dựng.

Ivan đưa tin về các phát triển công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy có trụ sở tại Ấn Độ và trước đây đã làm việc tại các ấn phẩm bao gồm Huffington Post và The Next Web. Bạn có thể liên hệ hoặc xác minh thông tin liên lạc từ Ivan bằng cách gửi email đến im@ivanmehta.com hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal. Xem Tiểu sử

DeepL mở rộng dịch vụ sang dịch giọng nói thời gian thực

Tóm tắt nhanh

Điểm chính

DeepL, nổi tiếng với dịch văn bản, giờ muốn dịch cả giọng nói của bạn

Góc nhìn từ cộng đồng