Từ LLM đến ảo giác: Hướng dẫn đơn giản về các thuật ngữ AI phổ biến

Từ LLM đến ảo giác, đây là hướng dẫn đơn giản về các thuật ngữ AI phổ biến

Trí tuệ nhân tạo là một thế giới sâu sắc và phức tạp. Các nhà khoa học làm việc trong lĩnh vực này thường dựa vào biệt ngữ và tiếng lóng để giải thích những gì họ đang nghiên cứu. Do đó, chúng ta thường phải sử dụng những thuật ngữ kỹ thuật đó trong các bài viết về ngành công nghiệp trí tuệ nhân tạo. Đó là lý do tại sao chúng tôi nghĩ rằng sẽ hữu ích nếu tập hợp một bảng chú giải với các định nghĩa về một số từ và cụm từ quan trọng nhất mà chúng tôi sử dụng trong các bài viết của mình. Chúng tôi sẽ thường xuyên cập nhật bảng chú giải này để thêm các mục mới khi các nhà nghiên cứu liên tục khám phá ra các phương pháp mới để thúc đẩy ranh giới của trí tuệ nhân tạo đồng thời xác định các rủi ro an toàn mới nổi.

AGI

Trí tuệ nhân tạo tổng quát, hay AGI, là một thuật ngữ mơ hồ. Nhưng nó thường đề cập đến AI có khả năng hơn người trung bình ở nhiều, nếu không muốn nói là hầu hết, các nhiệm vụ. CEO của OpenAI, Sam Altman, gần đây đã mô tả AGI là "tương đương với một người trung bình mà bạn có thể thuê làm đồng nghiệp". Trong khi đó, điều lệ của OpenAI định nghĩa AGI là "các hệ thống tự chủ cao vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế". Hiểu biết của Google DeepMind hơi khác so với hai định nghĩa này; phòng thí nghiệm xem AGI là "AI ít nhất có khả năng như con người trong hầu hết các nhiệm vụ nhận thức". Bối rối? Đừng lo lắng - các chuyên gia đi đầu trong nghiên cứu AI cũng vậy.

AI agent

AI agent đề cập đến một công cụ sử dụng công nghệ AI để thực hiện một loạt các nhiệm vụ thay mặt bạn - vượt ra ngoài những gì một chatbot AI cơ bản hơn có thể làm - chẳng hạn như nộp chi phí, đặt vé hoặc bàn tại nhà hàng, hoặc thậm chí viết và duy trì mã. Tuy nhiên, như chúng tôi đã giải thích trước đây, có rất nhiều bộ phận chuyển động trong không gian mới nổi này, vì vậy "AI agent" có thể có nghĩa khác nhau đối với những người khác nhau. Cơ sở hạ tầng cũng vẫn đang được xây dựng để đáp ứng các khả năng dự kiến của nó. Nhưng khái niệm cơ bản ngụ ý một hệ thống tự trị có thể dựa vào nhiều hệ thống AI để thực hiện các nhiệm vụ nhiều bước.

Chuỗi suy nghĩ

Với một câu hỏi đơn giản, bộ não con người có thể trả lời mà không cần suy nghĩ quá nhiều về nó - những thứ như "con vật nào cao hơn, hươu cao cổ hay mèo?" Nhưng trong nhiều trường hợp, bạn thường cần bút và giấy để đưa ra câu trả lời đúng vì có các bước trung gian. Ví dụ: nếu một nông dân có gà và bò, và cùng nhau chúng có 40 đầu và 120 chân, bạn có thể cần viết ra một phương trình đơn giản để đưa ra câu trả lời (20 con gà và 20 con bò). Trong bối cảnh AI, suy luận chuỗi suy nghĩ cho các mô hình ngôn ngữ lớn có nghĩa là chia một vấn đề thành các bước trung gian nhỏ hơn để cải thiện chất lượng của kết quả cuối cùng. Thường mất nhiều thời gian hơn để có được câu trả lời, nhưng câu trả lời có nhiều khả năng chính xác hơn, đặc biệt là trong bối cảnh logic hoặc mã hóa. Các mô hình suy luận được phát triển từ các mô hình ngôn ngữ lớn truyền thống và được tối ưu hóa cho tư duy chuỗi suy nghĩ nhờ vào việc học tăng cường. (Xem: Mô hình ngôn ngữ lớn)

Tính toán

Mặc dù là một thuật ngữ đa nghĩa, nhưng tính toán thường đề cập đến sức mạnh tính toán quan trọng cho phép các mô hình AI hoạt động. Loại xử lý này thúc đẩy ngành công nghiệp AI, mang lại cho nó khả năng đào tạo và triển khai các mô hình mạnh mẽ của nó. Thuật ngữ này thường là viết tắt của các loại phần cứng cung cấp sức mạnh tính toán - những thứ như GPU, CPU, TPU và các hình thức cơ sở hạ tầng khác tạo thành nền tảng của ngành công nghiệp AI hiện đại.

Học sâu

Một tập hợp con của học máy tự cải thiện, trong đó các thuật toán AI được thiết kế với cấu trúc mạng nơ-ron nhân tạo (ANN) nhiều lớp. Điều này cho phép chúng tạo ra các tương quan phức tạp hơn so với các hệ thống dựa trên học máy đơn giản hơn, chẳng hạn như mô hình tuyến tính hoặc cây quyết định. Cấu trúc của các thuật toán học sâu lấy cảm hứng từ các đường dẫn kết nối lẫn nhau của các nơ-ron trong não người. Các mô hình AI học sâu có thể xác định các đặc điểm quan trọng trong dữ liệu, thay vì yêu cầu các kỹ sư con người xác định các tính năng này. Cấu trúc này cũng hỗ trợ các thuật toán có thể học hỏi từ các lỗi và thông qua quá trình lặp đi lặp lại và điều chỉnh, cải thiện các đầu ra của chính chúng. Tuy nhiên, các hệ thống học sâu yêu cầu rất nhiều điểm dữ liệu để mang lại kết quả tốt (hàng triệu hoặc hơn). Chúng cũng thường mất nhiều thời gian hơn để đào tạo so với các thuật toán học máy đơn giản hơn - vì vậy chi phí phát triển có xu hướng cao hơn. (Xem: Mạng nơ-ron)

Khuếch tán

Khuếch tán là công nghệ cốt lõi của nhiều mô hình AI tạo nghệ thuật, âm nhạc và văn bản. Lấy cảm hứng từ vật lý, các hệ thống khuếch tán từ từ "phá hủy" cấu trúc của dữ liệu - ví dụ: ảnh, bài hát, v.v. - bằng cách thêm nhiễu cho đến khi không còn gì. Trong vật lý, khuếch tán là tự phát và không thể đảo ngược - đường khuếch tán trong cà phê không thể được khôi phục về dạng hình khối. Nhưng các hệ thống khuếch tán trong AI nhằm mục đích học một loại quá trình "khuếch tán ngược" để khôi phục dữ liệu bị phá hủy, có được khả năng phục hồi dữ liệu từ nhiễu.

Chưng cất

Chưng cất là một kỹ thuật được sử dụng để trích xuất kiến thức từ một AI lớn