Bài công khaiNguồn: techcrunch.com1 phút đọc

Strava tuyên chiến với hành vi thu thập dữ liệu trái phép trước thềm IPO

Strava đang tăng cường các biện pháp bảo vệ để chống lại việc thu thập dữ liệu trái phép, đặc biệt là từ các công ty AI. Họ sẽ yêu cầu các nhà phát triển trả phí hàng tháng để truy cập API của mình và tăng cường bảo mật trang web bằng cách yêu cầu xác thực người dùng để xem một số dữ liệu. CEO của Strava cho rằng việc thu thập dữ liệu tràn lan có thể gây ảnh hưởng tiêu cực đến hiệu suất trang web và vi phạm các điều khoản sử dụng API.

Tín hiệu0đánh giá có chiều sâu
Thảo luận0bình luận dưới bài
Chủ đề3nhánh tri thức liên quan
Nguồn gốctechcrunch.comhttps://techcrunch.com/2026/06/01/strava-declares-war-on-scrapers-ahead-of-ipo/

Tóm tắt nhanh

Strava đang tăng cường các biện pháp bảo vệ để chống lại việc thu thập dữ liệu trái phép, đặc biệt là từ các công ty AI. Họ sẽ yêu cầu các nhà phát triển trả phí hàng tháng để truy cập API của mình và tăng cường bảo mật trang web bằng cách yêu cầu xác thực người dùng để xem một số dữ liệu. CEO của Strava cho rằng việc thu thập dữ liệu tràn lan có thể gây ảnh hưởng tiêu cực đến hiệu suất trang web và vi phạm các điều khoản sử dụng API.

Điểm chính

  • Strava tăng cường bảo mật và thu phí API để chống lại hành vi thu thập dữ liệu trái phép.
  • Các công ty AI thu thập dữ liệu quy mô lớn đang gây ảnh hưởng đến hiệu suất trang web.
  • Strava từ chối các đề nghị cấp phép dữ liệu từ các phòng thí nghiệm AI lớn.

Strava tuyên chiến với hoạt động thu thập dữ liệu trái phép trước thềm IPO

Các công ty AI đã phát triển thành những thực thể khát dữ liệu khi các mô hình của họ đòi hỏi các bộ dữ liệu ngày càng lớn hơn để huấn luyện. Để đáp ứng nhu cầu đó, nhiều startup AI bất chấp các quy ước internet lâu đời — chẳng hạn như tôn trọng các tệp robots.txt, vốn báo hiệu cho các trình thu thập dữ liệu tự động biết những phần nào của một trang web là vùng cấm — và thu thập dữ liệu một cách ráo riết. Điều này đã buộc các trang web phải hạn chế quyền truy cập vào dữ liệu của họ và, trong một số trường hợp, ký kết các thỏa thuận cấp phép với các công ty AI. Công ty thể dục và mạng xã hội chạy bộ Strava đang thực hiện một động thái theo hướng này bằng cách hạn chế trang web của mình và đưa ra mức phí cho quyền truy cập của nhà phát triển. Để ngăn chặn hành vi thu thập dữ liệu trái phép, công ty đang tăng cường bảo mật cho trang web của mình và giờ đây sẽ chỉ cho phép người dùng đã xác thực xem các dữ liệu nhất định. Trước đây, người dùng có thể xem các chi tiết như hồ sơ công khai và danh sách câu lạc bộ thể dục mà không cần đăng nhập. Công ty đang đưa tất cả dữ liệu đó sau lớp xác thực để bảo vệ nó khỏi hành vi thu thập dữ liệu AI trái phép.

Về mặt API, các nhà phát triển trước đây có thể bắt đầu xây dựng các ứng dụng trên Strava thông qua một chương trình truy cập phân cấp miễn phí — đăng ký quyền truy cập cơ bản trước, sau đó yêu cầu thêm khi ứng dụng của họ phát triển. Giờ đây, công ty đang thêm một khoản phí cố định là 11,99 đô la mỗi tháng cho tất cả các nhà phát triển, mặc dù họ lưu ý rằng giá có thể khác nhau tùy theo khu vực. Strava cho biết cộng đồng nhà phát triển của họ đã tăng từ 185.000 thành viên vào năm ngoái lên 241.000 thành viên trong năm nay và công ty có kế hoạch tiếp tục hỗ trợ họ. Là một phần của điều đó, Strava cũng có kế hoạch thêm hỗ trợ cho Giao thức Ngữ cảnh Mô hình (MCP), một tiêu chuẩn mới nổi cho phép các trợ lý và ứng dụng AI truy cập dữ liệu bên ngoài một cách có cấu trúc, giúp Strava kiểm soát chặt chẽ hơn những gì được chia sẻ và cách thức chia sẻ.

Công ty cũng có kế hoạch ngừng hoạt động một số điểm cuối API — các điểm truy cập riêng biệt cho phép các ứng dụng bên ngoài lấy dữ liệu cụ thể, như chi tiết câu lạc bộ — để bảo vệ dữ liệu người dùng. Strava đã thắt chặt các quy tắc API vào năm 2024, cấm sử dụng API cho việc đào tạo AI và hạn chế các ứng dụng của bên thứ ba hiển thị dữ liệu của người dùng khác. Những thay đổi đó đã gây ra phản ứng dữ dội từ các nhà phát triển, những người nói rằng các ứng dụng của họ sẽ bị ảnh hưởng nghiêm trọng. Mặc dù một số nhà phát triển có thể chấp nhận trả phí đăng ký, nhưng việc ngừng hoạt động một số điểm cuối API nhất định vẫn có thể ảnh hưởng đến các ứng dụng phụ thuộc. Strava đang cho các nhà phát triển thời gian gia hạn 90 ngày trước khi thực hiện những thay đổi này.

Trong một cuộc phỏng vấn với TechCrunch, Michael Martin, Giám đốc điều hành của Strava, cho biết hành vi thu thập dữ liệu AI không được kiểm soát có thể là dấu chấm hết cho internet công cộng. “Các công ty AI đang thu thập dữ liệu trái phép từ các trang web công cộng một cách tàn nhẫn, do nhu cầu vô tận về dữ liệu đào tạo của họ, điều này đang làm giảm hiệu suất trang web trên diện rộng,” Martin nói. “Chúng tôi đã có nhiều trường hợp trong vài tháng qua hiệu suất bị giảm sút và, trong một số trường hợp, bị suy giảm. Ngoài việc thu thập dữ liệu trái phép từ các trang web công cộng, họ còn cố gắng sử dụng API của chúng tôi để có quyền truy cập vào dữ liệu của chúng tôi, bỏ qua các điều khoản API.” Ông lưu ý rằng Strava đã từ chối những lời đề nghị từ các phòng thí nghiệm AI hàng đầu tìm kiếm các thỏa thuận cấp phép dữ liệu. Ông đặc biệt chỉ trích Perplexity, nói rằng startup tìm kiếm AI này đã định tuyến hoạt động thu thập dữ liệu trái phép của mình thông qua các dịch vụ tổng hợp để che giấu nguồn gốc của nó mặc dù đã bị từ chối. Điều này phù hợp với việc Perplexity đã bị cáo buộc có hành vi tương tự ở những nơi khác trong quá khứ.

Martin cũng nêu bật tình trạng quá tải máy chủ do các ứng dụng được mã hóa vibe kém, có các lệnh gọi API thường được cấu trúc không hiệu quả và tạo ra tải trọng không cân xứng trên hệ thống của Strava. Đó là một mô hình: khi Meta cấm chatbot của bên thứ ba khỏi WhatsApp vào năm ngoái, họ đã đưa ra một lập luận tương tự về chi phí hệ thống. Thời điểm có lẽ không phải là ngẫu nhiên. Strava đã bí mật nộp đơn IPO vào đầu năm nay và động thái bảo vệ dữ liệu của họ có thể nhằm mục đích báo hiệu kỷ luật dữ liệu cho các nhà đầu tư tiềm năng. Sự so sánh với việc Reddit đàn áp quyền truy cập API năm 2024 là một điều mà Martin đã nhanh chóng giải quyết. Không giống như Reddit, nơi định giá quyền truy cập API theo số lượng lệnh gọi (khiến nó không thể chi trả được đối với nhiều nhà phát triển ứng dụng), Strava đang đặt cược rằng một khoản phí cố định sẽ giữ cho hệ sinh thái nhà phát triển còn nguyên vẹn. “Chúng tôi muốn người dùng cảm thấy rằng họ sở hữu dữ liệu của mình và cảm thấy thoải mái với cách chúng tôi kiểm soát và bảo mật nó. Nhưng chúng tôi muốn các nhà phát triển tiếp tục phát triển và thịnh vượng,” Martin nói.

Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi. Ivan phụ trách các diễn biến công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy có trụ sở tại Ấn Độ và trước đây đã làm việc tại các ấn phẩm bao gồm Huffington Post và The Next Web. Bạn có thể liên hệ hoặc xác minh thông tin từ Ivan bằng cách gửi email đến im@ivanmehta.com hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal.

aibusinesstechnology

Discussion

Góc nhìn từ cộng đồng

0 bình luận
Chưa có bình luận nào.

Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.