Internet đang được tái thiết kế cho máy móc
Hạ tầng đám mây từ lâu đã được thiết kế xoay quanh con người, những người tìm kiếm, nhấp chuột, cuộn trang và phát trực tuyến một cách đều đặn và có thể dự đoán được. Các tác nhân AI (AI agents) lại hoạt động khác. Chúng có thể giải phóng một làn sóng hoạt động, tạo ra nhiều tác nhân phụ truy vấn hàng trăm cơ sở dữ liệu, tìm kiếm tài liệu và gọi API chỉ trong vài giây, rồi biến mất nhanh chóng như khi chúng xuất hiện. Dựa trên tiền đề đó, Amazon đang thiết kế lại một phần cốt lõi trong cơ sở hạ tầng đám mây của mình. Hôm thứ Năm, AWS đã ra mắt thế hệ tiếp theo của OpenSearch Serverless, một cơ sở dữ liệu tìm kiếm và vector được quản lý hoàn toàn — về cơ bản là một hệ thống để lưu trữ và truy xuất thông tin ở quy mô lớn — được thiết kế đặc biệt cho các khối lượng công việc do tác nhân (agentic workloads) đảm nhiệm. AWS cho biết hệ thống mới có thể mở rộng ngay lập tức khi các tác nhân kích hoạt tác vụ và thu nhỏ trở lại về không khi không hoạt động.
Việc ra mắt này phản ánh một nhận thức ngày càng tăng trên toàn ngành công nghệ: cơ sở hạ tầng ban đầu được thiết kế cho một internet do con người điều khiển không hoạt động hiệu quả trong một thế giới ngày càng có nhiều tác nhân. Mặc dù các tác nhân AI vẫn chỉ chiếm một phần tương đối nhỏ trong hoạt động internet, nhưng lưu lượng truy cập do máy tạo ra đã đáng kể và có khả năng tăng trưởng. Cloudflare cho biết bot chiếm 31% tổng lưu lượng HTTP trong sáu tháng qua. Các trình thu thập dữ liệu AI, công cụ tìm kiếm và trợ lý chiếm khoảng một phần tư tổng số yêu cầu của bot trong giai đoạn đó.
“Lưu lượng truy cập không phải do con người tạo ra sẽ vượt quá lưu lượng truy cập của con người vào khoảng nửa đầu năm 2027,” Li Yi Ohlsen, quản lý sản phẩm cấp cao tại Cloudflare, nói với TechCrunch.
Tại hội nghị các nhà phát triển I/O của Google tuần trước, công ty cho biết người dùng sẽ có thể bắt đầu ủy quyền các tác vụ cho hệ thống AI, chẳng hạn như nghiên cứu mua hàng, đặt chuyến đi, duyệt web và tương tác với ứng dụng. Nhưng mọi thứ không dừng lại ở các tác nhân AI tập trung vào người tiêu dùng. Các doanh nghiệp ngày càng triển khai các tác nhân nội bộ và cho khách hàng của họ, tạo ra các loại lưu lượng truy cập do máy tạo ra mới ở hậu trường. Do đó, các nhà cung cấp đám mây và công ty cơ sở hạ tầng đã phải vật lộn với việc làm thế nào để điều chỉnh các hệ thống được xây dựng cho con người sang một thế giới của các tác nhân liên tục và tự động truy xuất thông tin, gọi các công cụ và tạo ra lưu lượng truy cập từ máy sang máy. Đó là nơi OpenSearch Serverless mới của AWS xuất hiện.
“Thời điểm này rất rõ ràng. Các tác nhân đang chuyển từ giai đoạn thử nghiệm sang sản xuất và chúng tạo ra các kiểu lưu lượng truy cập mà cơ sở hạ tầng trước đây đơn giản là không được thiết kế cho,” Tia White, tổng giám đốc của Amazon OpenSearch Service, nói với TechCrunch. “Chúng tăng đột biến mà không báo trước, chúng ngừng hoạt động mà không thông báo và doanh nghiệp cần tìm kiếm để theo kịp mà không phải trả tiền cho điện toán trống hoặc nhàn rỗi.”
Thay đổi kỹ thuật quan trọng với thế hệ mới này là nó tách biệt tính toán khỏi lưu trữ, cho phép tính toán mở rộng trong vài giây để đáp ứng lưu lượng truy cập của tác nhân và thu nhỏ xuống 0, vì vậy khách hàng trả 0 đô la khi các tác nhân không hoạt động. “Trước đây, ngay cả trong phiên bản Serverless trước đây của chúng tôi, bạn phải có ít nhất một phiên bản hoạt động và chạy vì bộ nhớ và tính toán được ghép nối,” White nói. “Bạn không thể chỉ tự động khởi động [tính toán] với tốc độ bạn cần, vì vậy bạn luôn có tính toán nhàn rỗi dành riêng cho khối lượng công việc của mình, cho dù bạn có sử dụng nó hay không.”
Hãy nghĩ về nó như việc luôn trả tiền cho một chỗ đậu xe, ngay cả khi bạn không sử dụng nó. Với Serverless được nâng cấp của AWS, nó giống như trả tiền cho một chỗ đậu xe có đồng hồ tính tiền hơn. Khi ra mắt, OpenSearch Serverless sẽ tích hợp nguyên bản với các nền tảng phát triển AI như Vercel và Kiro, để các nhà phát triển có thể triển khai các phần phụ trợ tìm kiếm và vector sẵn sàng sản xuất cho các tác nhân mà không cần quản lý cơ sở hạ tầng. Sự thay đổi đang nổi lên trên toàn ngành công nghiệp đám mây. Databricks và Snowflake đang định vị lại mình là hệ thống bộ nhớ và truy xuất AI cho dữ liệu doanh nghiệp. Microsoft đã tung ra các bản cập nhật cho Azure được thiết kế để xử lý các đợt tăng đột biến của tác nhân AI và chia sẻ bộ nhớ giữa các tác nhân. Cloudflare, tương tự như Amazon, tháng trước đã giới thiệu cơ sở hạ tầng nhằm cung cấp cho các tác nhân môi trường liên tục và khả năng mở rộng tức thì.
Càng có nhiều công ty triển khai tác nhân AI, càng có nhiều áp lực phải thiết kế lại cơ sở hạ tầng xung quanh khối lượng công việc do máy tạo ra, từ đó có thể giúp các tác nhân rẻ hơn và dễ triển khai hơn ở quy mô lớn hơn.
Loading the player…
Khi bạn mua hàng qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi. Rebecca Bellan là phóng viên cấp cao tại TechCrunch, nơi cô đưa tin về các hoạt động kinh doanh, chính sách và xu hướng mới nổi định hình trí tuệ nhân tạo. Tác phẩm của cô cũng đã xuất hiện trên Forbes, Bloomberg, The Atlantic, The Daily Beast và các ấn phẩm khác. Bạn có thể liên hệ hoặc xác minh thông tin liên lạc từ Rebecca bằng cách gửi email đến rebecca.bellan@techcrunch.com hoặc qua tin nhắn được mã hóa tại rebeccabellan.491 trên Signal.
View Bio
Góc nhìn từ cộng đồng
Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.