Anthropic giới hạn phát hành Mythos để bảo vệ internet hay bảo vệ chính mình?

Anthropic đang giới hạn việc phát hành Mythos để bảo vệ Internet — hay để bảo vệ Anthropic?

Anthropic tuần này cho biết họ đã giới hạn việc phát hành mô hình mới nhất của mình, có tên là Mythos, vì nó có khả năng tìm ra các lỗ hổng bảo mật trong phần mềm mà người dùng trên toàn thế giới đang sử dụng. Thay vì tung Mythos ra công chúng, phòng thí nghiệm tiên phong này sẽ chia sẻ nó với một nhóm các công ty và tổ chức lớn vận hành cơ sở hạ tầng trực tuyến quan trọng, từ Amazon Web Services đến JPMorgan Chase. OpenAI cũng được cho là đang xem xét một kế hoạch tương tự cho công cụ an ninh mạng tiếp theo của mình. Ý tưởng rõ ràng là để các doanh nghiệp lớn này đi trước những kẻ xấu có thể tận dụng các LLM (mô hình ngôn ngữ lớn) tiên tiến để xâm nhập vào phần mềm an toàn.

Nhưng từ "e" trong câu trên là một gợi ý rằng chiến lược phát hành này có thể liên quan đến nhiều hơn là an ninh mạng — hoặc thổi phồng khả năng của mô hình. Dan Lahav, Giám đốc điều hành của phòng thí nghiệm an ninh mạng AI Irregular, nói với TechCrunch vào tháng 3, trước khi Mythos được phát hành, rằng mặc dù việc các công cụ AI phát hiện ra các lỗ hổng là quan trọng, nhưng giá trị cụ thể của bất kỳ điểm yếu nào đối với kẻ tấn công phụ thuộc vào nhiều yếu tố, bao gồm cả cách chúng có thể được sử dụng kết hợp với nhau. "Câu hỏi luôn ở trong đầu tôi," Lahav nói, "là họ có tìm thấy điều gì đó có thể khai thác một cách có ý nghĩa hay không, dù là riêng lẻ hay là một phần của một chuỗi?"

Anthropic nói rằng Mythos có thể khai thác các lỗ hổng nhiều hơn so với mô hình Opus trước đây của họ. Nhưng không rõ liệu Mythos có thực sự là tất cả và là cuối cùng của các mô hình an ninh mạng hay không. Aisle, một startup về an ninh mạng AI, cho biết họ đã có thể sao chép phần lớn những gì Anthropic nói Mythos đã đạt được bằng cách sử dụng các mô hình có trọng số mở nhỏ hơn. Nhóm của Aisle cho rằng những kết quả này cho thấy không có một mô hình học sâu duy nhất cho an ninh mạng, mà thay vào đó phụ thuộc vào nhiệm vụ đang thực hiện.

Với việc Opus đã được coi là một yếu tố thay đổi cuộc chơi cho an ninh mạng, có một lý do khác khiến các phòng thí nghiệm tiên phong có thể muốn giới hạn việc phát hành của họ cho các tổ chức lớn: Nó tạo ra một động lực cho các hợp đồng doanh nghiệp lớn, đồng thời gây khó khăn hơn cho các đối thủ cạnh tranh trong việc sao chép các mô hình của họ bằng cách sử dụng chưng cất, một kỹ thuật tận dụng các mô hình tiên phong để đào tạo các LLM mới với chi phí thấp.

"Đây là vỏ bọc marketing cho thực tế là các mô hình cao cấp hiện được kiểm soát bởi các thỏa thuận doanh nghiệp và không còn có sẵn cho các phòng thí nghiệm nhỏ để chưng cất," David Crawshaw, một kỹ sư phần mềm và Giám đốc điều hành của startup exe.dev, gợi ý trong một bài đăng trên mạng xã hội. "Khi bạn và tôi có thể sử dụng Mythos, sẽ có một bản sửa đổi cao cấp mới chỉ dành cho doanh nghiệp. Băng chuyền đó giúp duy trì dòng tiền doanh nghiệp (vốn là phần lớn số tiền) bằng cách giáng chức các công ty chưng cất xuống hàng thứ hai," Crawshaw nói.

Phân tích đó phù hợp với những gì chúng ta đang thấy trong hệ sinh thái AI: Một cuộc chạy đua giữa các phòng thí nghiệm tiên phong phát triển các mô hình lớn nhất, có khả năng nhất và các công ty như Aisle dựa vào nhiều mô hình và coi các LLM mã nguồn mở, thường là từ Trung Quốc và thường được cho là phát triển thông qua chưng cất, như một con đường dẫn đến lợi thế kinh tế.

Các phòng thí nghiệm tiên phong đã có một đường lối cứng rắn hơn đối với việc chưng cất trong năm nay, với việc Anthropic công khai tiết lộ những gì họ nói là các nỗ lực của các công ty Trung Quốc để sao chép các mô hình của mình, và ba phòng thí nghiệm hàng đầu — Anthropic, Google và OpenAI — hợp tác để xác định các nhà chưng cất và chặn chúng, theo một báo cáo của Bloomberg. Chưng cất là một mối đe dọa đối với mô hình kinh doanh của các phòng thí nghiệm tiên phong vì nó loại bỏ những lợi thế có được bằng cách sử dụng một lượng vốn khổng lồ để mở rộng quy mô. Vì vậy, việc chặn chưng cất đã là một nỗ lực đáng giá, nhưng cách tiếp cận phát hành có chọn lọc để làm như vậy cũng mang đến cho các phòng thí nghiệm một cách để phân biệt các sản phẩm doanh nghiệp của họ khi danh mục này trở thành chìa khóa để triển khai có lợi nhuận.

Liệu Mythos hoặc bất kỳ mô hình mới nào có thực sự đe dọa đến an ninh của Internet hay không vẫn còn phải xem xét, và việc triển khai công nghệ một cách cẩn thận là một cách tiến lên có trách nhiệm. Anthropic đã không trả lời các câu hỏi của chúng tôi về việc liệu quyết định này có liên quan đến những lo ngại về chưng cất hay không tại thời điểm báo chí, nhưng công ty có thể đã tìm ra một cách tiếp cận thông minh để bảo vệ Internet — và lợi nhuận của mình.

Về tác giả

Tim Fernholz là một nhà báo viết về công nghệ, tài chính và chính sách công. Ông đã theo sát sự trỗi dậy của ngành công nghiệp vũ trụ tư nhân và là tác giả của cuốn sách Rocket Billionaires: Elon Musk, Jeff Bezos and the New Space Race. Trước đây, ông là phóng viên cấp cao tại Quartz, trang tin tức kinh doanh toàn cầu, trong hơn một thập kỷ và bắt đầu sự nghiệp của mình với tư cách là một phóng viên chính trị ở Washington, D.C. Bạn có thể liên hệ hoặc xác minh thông tin từ Tim bằng cách gửi email tới tim.fernholz@techcrunch.com hoặc thông qua tin nhắn được mã hóa tới tim_fernholz.21 trên Signal.

Anthropic giới hạn phát hành Mythos để bảo vệ internet hay bảo vệ chính mình?

Tóm tắt nhanh

Điểm chính

Anthropic đang giới hạn việc phát hành Mythos để bảo vệ Internet — hay để bảo vệ Anthropic?

Về tác giả

Góc nhìn từ cộng đồng