Bài công khaiNguồn: developers.cloudflare.com1 phút đọc

Tính năng phiên âm thời gian thực trong RealtimeKit hỗ trợ 10 ngôn ngữ và các biến thể khu vực

RealtimeKit hiện đã hỗ trợ phiên âm thời gian thực cho 10 ngôn ngữ khác nhau và các biến thể khu vực của chúng, được cung cấp bởi Deepgram Nova-3 chạy trên Workers AI. Việc này cho phép phiên âm trực tiếp trên mạng lưới Cloudflare, giảm độ trễ so với việc sử dụng các dịch vụ bên ngoài. Người dùng có thể chỉ định ngôn ngữ mong muốn thông qua ai_config.transcription.language.

Tín hiệu0đánh giá có chiều sâu
Thảo luận0bình luận dưới bài
Chủ đề2nhánh tri thức liên quan
Nguồn gốcdevelopers.cloudflare.comhttps://developers.cloudflare.com/changelog/post/2026-03-06-realtimekit-multilingual-transcription/

Tóm tắt nhanh

RealtimeKit hiện đã hỗ trợ phiên âm thời gian thực cho 10 ngôn ngữ khác nhau và các biến thể khu vực của chúng, được cung cấp bởi Deepgram Nova-3 chạy trên Workers AI. Việc này cho phép phiên âm trực tiếp trên mạng lưới Cloudflare, giảm độ trễ so với việc sử dụng các dịch vụ bên ngoài. Người dùng có thể chỉ định ngôn ngữ mong muốn thông qua ai_config.transcription.language.

Điểm chính

  • RealtimeKit hỗ trợ phiên âm thời gian thực cho 10 ngôn ngữ và biến thể khu vực.
  • Sử dụng Deepgram Nova-3 trên Workers AI để giảm độ trễ.
  • Có thể chỉ định ngôn ngữ phiên âm thông qua ai_config.transcription.language.

Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực

Nhật ký thay đổi. Các bản cập nhật và cải tiến mới tại Cloudflare. Đăng ký RSS Xem nguồn cấp RSS ← Quay lại tất cả các bài đăng

Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực. 06 tháng 3, 2026. Workers AI. Realtime.

Tính năng chuyển âm thanh thành văn bản theo thời gian thực trong RealtimeKit hiện hỗ trợ 10 ngôn ngữ với các biến thể khu vực, được hỗ trợ bởi Deepgram Nova-3 chạy trên Workers AI. Trong một cuộc họp, âm thanh của người tham gia được định tuyến thông qua AI Gateway đến Nova-3 trên Workers AI — vì vậy, quá trình chuyển âm thanh thành văn bản chạy trên mạng lưới đầu cuối của Cloudflare, giảm độ trễ so với việc định tuyến thông qua các dịch vụ chuyển giọng nói thành văn bản bên ngoài.

Đặt ngôn ngữ khi tạo cuộc họp thông qua ai_config.transcription.language:

{ "ai_config": { "transcription": { "language": "fr" } }}

Các ngôn ngữ được hỗ trợ bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Hindi, tiếng Nga, tiếng Bồ Đào Nha, tiếng Nhật, tiếng Ý và tiếng Hà Lan — với các biến thể khu vực như en-AU, en-GB, en-IN, en-NZ, es-419, fr-CA, de-CH, pt-BR và pt-PT. Sử dụng multi để tự động phát hiện đa ngôn ngữ.

Nếu bạn đang xây dựng các tác nhân giọng nói hoặc quy trình làm việc dịch thuật theo thời gian thực, tác nhân của bạn giờ đây có thể chuyển âm thanh thành văn bản bằng ngôn ngữ của người gọi một cách tự nhiên — không cần thêm dịch vụ hoặc logic định tuyến.

Tài liệu chuyển âm thanh thành văn bản

Trang mô hình Nova-3

Workers AI

AI Gateway

aitechnology

Discussion

Góc nhìn từ cộng đồng

0 bình luận
Chưa có bình luận nào.

Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.