Bài công khaiNguồn: techcrunch.com1 phút đọc

Stability AI ra mắt mô hình âm thanh mới có thể tạo ra các bài hát dài sáu phút

Stability AI, công ty đứng sau Stable Diffusion, đã phát hành Stability Audio 3.0, một dòng mô hình âm thanh mới. Mô hình hàng đầu có thể tạo ra âm nhạc chất lượng chuyên nghiệp dài hơn sáu phút. Các mô hình nhỏ có thể chạy trên thiết bị và tạo ra các đoạn nhạc dài hai phút.

Tín hiệu0đánh giá có chiều sâu
Thảo luận0bình luận dưới bài
Chủ đề3nhánh tri thức liên quan
Nguồn gốctechcrunch.comhttps://techcrunch.com/2026/05/20/stability-ai-release-a-new-audio-model-that-can-create-six-minute-songs/

Tóm tắt nhanh

Stability AI, công ty đứng sau Stable Diffusion, đã phát hành Stability Audio 3.0, một dòng mô hình âm thanh mới. Mô hình hàng đầu có thể tạo ra âm nhạc chất lượng chuyên nghiệp dài hơn sáu phút. Các mô hình nhỏ có thể chạy trên thiết bị và tạo ra các đoạn nhạc dài hai phút.

Điểm chính

  • Stability AI phát hành Stability Audio 3.0 với bốn mô hình khác nhau.
  • Các mô hình tầm trung và lớn có thể tạo ra các tác phẩm dài tới 6 phút 20 giây.
  • Stability AI đang phát triển bộ sản phẩm mới dành cho nhạc sĩ chuyên nghiệp.

Stability AI ra mắt mô hình âm thanh mới có thể tạo ra các bài hát dài sáu phút

Stability AI, công ty đứng sau Stable Diffusion, đang phát hành một dòng mô hình âm thanh mới, có tên gọi Stability Audio 3.0. Công ty tuyên bố rằng mô hình hàng đầu có thể tạo ra âm nhạc chất lượng chuyên nghiệp với độ dài hơn sáu phút.

Công ty đang phát hành bốn mô hình mới dưới tên gọi Stable Audio 3.0: small SFX (459 triệu tham số), small (459 triệu tham số), medium (1,4 tỷ tham số) và large (2,7 tỷ tham số). Bộ đôi mô hình small phù hợp cho việc tạo âm thanh và âm nhạc trên thiết bị với thời lượng lên đến hai phút. Cả mô hình medium và large đều có thể tạo ra các tác phẩm hoàn chỉnh với thời lượng 6 phút 20 giây, có khả năng duy trì cấu trúc âm nhạc và giai điệu du dương. Điều này dài hơn gấp đôi so với khả năng của Stable Audio 2.0, được phát hành vào năm 2024.

Stability AI đang cung cấp các mô hình small SFX, small và medium với trọng số mở để bất kỳ ai cũng có thể sử dụng và sửa đổi. Vào năm 2024, công ty đã phát hành Stable Audio Open, cho phép tạo nhạc với thời lượng lên đến 47 giây. Dòng mô hình mới này là một bước tiến lớn so với các phiên bản mở trước đây.

Image Credits: Stability AIImage Credits:Stability AI

Mô hình large chỉ khả dụng thông qua API và các dịch vụ trả phí tự lưu trữ. Ngoài ra, các công ty có doanh thu hơn 1 triệu đô la sẽ cần phải có giấy phép doanh nghiệp. Nhiều công ty, bao gồm Google và ElevenLabs, đang phát hành các mô hình và công cụ xung quanh việc tạo nhạc. Tuy nhiên, như các cuộc chiến pháp lý đang diễn ra của Suno và Udio đã chứng minh, việc cấp phép dữ liệu và hợp tác với các hãng thu âm có thể trở thành một phần quan trọng trong sự tồn tại lâu dài của các dịch vụ này.

Năm ngoái, Stability AI đã ký thỏa thuận với Warner Music Group và Universal Music Group để phát triển các mô hình và công cụ sáng tạo âm nhạc. Công ty cho biết rằng bộ mô hình âm thanh mới nhất của họ được xây dựng trên dữ liệu được cấp phép đầy đủ. Công ty khởi nghiệp AI này đang phát triển một bộ sản phẩm mới dành cho các nhạc sĩ chuyên nghiệp, nhưng không đưa ra thêm chi tiết về các tính năng của nó.

Ethan Kaplan, cựu giám đốc kỹ thuật số tại Universal Audio và Fender, đang gia nhập công ty để lãnh đạo bộ phận cung cấp âm nhạc chuyên nghiệp của Stability. Một số công ty AI đang cố gắng củng cố uy tín của mình bằng cách thuê các giám đốc âm nhạc. Đầu năm nay, Suno đã thuê cựu CEO của Merlin, Jeremy Sirota, làm giám đốc thương mại. ElevenLabs cũng đã thuê Derek Cournoyer từ nhà xuất bản âm nhạc độc lập Kobalt làm trưởng nhóm chiến lược cho mảng kinh doanh âm nhạc của mình.

Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.

Ivan phụ trách các diễn biến công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy làm việc tại Ấn Độ và trước đây đã từng làm việc tại các ấn phẩm như Huffington Post và The Next Web. Bạn có thể liên hệ hoặc xác minh liên lạc từ Ivan bằng cách gửi email đến im@ivanmehta.com hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal. View Bio

aibusinesstechnology

Discussion

Góc nhìn từ cộng đồng

0 bình luận
Chưa có bình luận nào.

Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.