Tại sao AI của Google lại không thể đánh vần được chữ Google (hoặc bất cứ từ nào khác)
Có bao nhiêu chữ P trong từ Google? Theo Google, có hai. AI Tổng quan của Google cũng khẳng định rằng "có đúng 1 chữ 'r' trong từ 'poop'", cũng như hai chữ 'd' trong từ journalism, nhưng lại đánh vần là: j-o-u-r-n-a-d-i-s-m. Google ít nhất cũng xác định được có một chữ P trong họ của tổng thống Hoa Kỳ, nhưng lại đánh vần là t-r-p-u-m. Bạn không cần phải là nhà tiên tri để dự đoán rằng việc đại tu Tìm kiếm của Google theo hướng AI sẽ diễn ra không suôn sẻ. Chúng ta đã từng trải qua chuyện này rồi. Lần đầu tiên Google thêm AI Tổng quan vào Tìm kiếm, tính năng này đã trích dẫn các bài viết châm biếm từ The Onion và Reddit, khuyên mọi người nên ăn đá và bôi keo lên pizza. Lần này, khi Google tăng gấp đôi cam kết biến AI tạo sinh thành trọng tâm của sản phẩm chủ lực đã 29 năm tuổi của mình, không có gì ngạc nhiên khi thấy nó vấp ngã.
“Đếm số lượng ký tự trong từ là một thách thức đã được biết đến đối với LLM và chúng tôi đang nỗ lực khắc phục vấn đề cụ thể này,” Google nói với TechCrunch trong một tuyên bố qua email. Những lỗi chính tả cơ bản này có vẻ quen thuộc. LLM, loại trí tuệ nhân tạo cung cấp sức mạnh cho chatbot và các trình tạo văn bản khác, không được xây dựng để hiểu chính tả. Đã nhiều năm nay, việc mỗi khi một công ty giới thiệu một mô hình AI mới, bạn nên hỏi nó có bao nhiêu chữ 'r' trong từ strawberry, đã trở thành một trò đùa. Những mô hình AI này - có thể viết mã một ứng dụng trong vài giây hoặc giải quyết các vấn đề đã làm khó các nhà toán học trong nhiều thập kỷ - đánh vần giỏi ngang với một đứa trẻ mẫu giáo.
Tuy nhiên, những rắc rối về AI Tổng quan của Google không chỉ dừng lại ở những lỗi chính tả ngớ ngẩn. Google đã vá một lỗi từ tuần trước, trong đó việc tìm kiếm từ "disregard" sẽ cho ra kết quả trông giống như định nghĩa từ điển của từ đó, chỉ có điều định nghĩa được hiển thị là, "Đã hiểu. Hãy cho tôi biết bất cứ khi nào bạn có một lời nhắc hoặc câu hỏi mới!" Nhưng những lỗi chính tả này vẫn gây cười vì chúng rất khó loại bỏ. Như các nhà nghiên cứu đã giải thích trước đây khi chúng tôi hỏi về những câu đố chính tả này, AI không nhận thức được các câu như các đơn vị ngôn ngữ được tạo thành từ các từ và chữ cái. Nhiều LLM được xây dựng dựa trên các mô hình biến đổi, chia văn bản thành các token, có thể là toàn bộ từ, âm tiết hoặc chữ cái, tùy thuộc vào mô hình. Thay vì "đọc" như một người sẽ làm, AI chuyển đổi văn bản thành các biểu diễn số của chính nó, sau đó được ngữ cảnh hóa để giúp AI đưa ra phản hồi hợp lý.
Nguồn ảnh: TechCrunch
“LLM dựa trên kiến trúc biến đổi này, điều đáng chú ý là thực sự không đọc văn bản. Điều gì xảy ra khi bạn nhập một lời nhắc là nó được dịch thành một mã hóa,” Matthew Guzdial, một nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, nói với TechCrunch. “Khi nó nhìn thấy từ 'the', nó có một mã hóa về ý nghĩa của 'the', nhưng nó không biết về 'T', 'H', 'E'." Kiến trúc dựa trên token cung cấp sức mạnh cho LLM như AI Tổng quan của Google vốn đã có những hạn chế, và các nhà nghiên cứu không lạc quan rằng họ có thể giải quyết vấn đề chính tả.
“Khá khó để né tránh câu hỏi chính xác một 'từ' nên là gì đối với một mô hình ngôn ngữ, và ngay cả khi chúng tôi có được các chuyên gia là con người đồng ý về một từ vựng token hoàn hảo, các mô hình có lẽ vẫn thấy hữu ích khi 'chia nhỏ' mọi thứ hơn nữa,” Sheridan Feucht, một nghiên cứu sinh tiến sĩ nghiên cứu về khả năng diễn giải mô hình ngôn ngữ lớn tại Đại học Northeastern, nói với TechCrunch. “Tôi đoán rằng không có thứ gì gọi là một trình tạo token hoàn hảo do sự mơ hồ này."
Đây không nhất thiết là một vấn đề cấp bách trong tâm trí các nhà nghiên cứu, vì tính hữu dụng của LLM không nằm ở khả năng đánh vần của chúng. Nhưng những thất bại trắng trợn này giúp chúng ta nhớ rằng AI không hoàn hảo, ngay cả khi đôi khi nó có vẻ như một sức mạnh toàn triệt vượt quá tầm hiểu biết của chúng ta. Chúng ta không thể tin tưởng một cách mù quáng vào các kết quả đầu ra của AI mà không kiểm tra kỹ độ chính xác của chúng.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Amanda Silberling là một nhà văn cao cấp tại TechCrunch, chuyên viết về giao điểm giữa công nghệ và văn hóa. Cô cũng đã viết cho các ấn phẩm như Polygon, MTV, the Kenyon Review, NPR và Business Insider. Cô là người đồng dẫn chương trình Wow If True, một podcast về văn hóa internet, với tác giả khoa học viễn tưởng Isabel J. Kim. Trước khi gia nhập TechCrunch, cô làm việc với tư cách là một nhà tổ chức cơ sở, nhà giáo dục bảo tàng và điều phối viên liên hoan phim. Cô có bằng Cử nhân Văn học Anh từ Đại học Pennsylvania và từng là Princeton in Asia Fellow ở Lào. Bạn có thể liên hệ hoặc xác minh liên hệ từ Amanda bằng cách gửi email đến amanda@techcrunch.com hoặc qua tin nhắn được mã hóa tại @amanda.100 trên Signal. Xem tiểu sử
Góc nhìn từ cộng đồng
Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.