Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực
Nhật ký thay đổi. Các bản cập nhật và cải tiến mới tại Cloudflare. Đăng ký RSS Xem nguồn cấp RSS ← Quay lại tất cả các bài đăng
Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực. 06 tháng 3, 2026. Workers AI. Realtime.
Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực, được hỗ trợ bởi Deepgram Nova-3 chạy trên Workers AI. Trong một cuộc họp, âm thanh của người tham gia được định tuyến thông qua AI Gateway đến Nova-3 trên Workers AI — vì vậy, quá trình chuyển âm thanh thành văn bản chạy trên mạng lưới đầu cuối của Cloudflare, giảm độ trễ so với việc định tuyến thông qua các dịch vụ chuyển giọng nói thành văn bản bên ngoài.
Đặt ngôn ngữ khi tạo cuộc họp thông qua ai_config.transcription.language:
{ "ai_config": { "transcription": { "language": "fr" } }}
Các ngôn ngữ được hỗ trợ bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Hindi, tiếng Nga, tiếng Bồ Đào Nha, tiếng Nhật, tiếng Ý và tiếng Hà Lan — với các biến thể khu vực như en-AU, en-GB, en-IN, en-NZ, es-419, fr-CA, de-CH, pt-BR và pt-PT. Sử dụng multi để tự động phát hiện đa ngôn ngữ.
Nếu bạn đang xây dựng các tác nhân giọng nói hoặc quy trình làm việc dịch thuật theo thời gian thực, tác nhân của bạn giờ đây có thể chuyển âm thanh thành văn bản bằng ngôn ngữ của người gọi một cách tự nhiên — không cần thêm dịch vụ hoặc logic định tuyến.
Góc nhìn từ cộng đồng
Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.