Các Neuron Nhận Tín Hiệu Dạy Học Được Điều Chỉnh Chính Xác Khi Chúng Ta Học Tập
Khi chúng ta học một kỹ năng mới, não bộ phải quyết định — tế bào này qua tế bào khác — những gì cần thay đổi. Nghiên cứu mới từ MIT cho thấy nó có thể làm điều đó với độ chính xác đáng ngạc nhiên, gửi phản hồi có mục tiêu đến từng neuron riêng lẻ để mỗi neuron có thể điều chỉnh hoạt động của nó theo đúng hướng.
Phát hiện này lặp lại một ý tưởng quan trọng từ trí tuệ nhân tạo hiện đại. Nhiều hệ thống AI học bằng cách so sánh đầu ra của chúng với một mục tiêu, tính toán một tín hiệu "lỗi" và sử dụng nó để tinh chỉnh các kết nối trong mạng. Một câu hỏi lâu đời là liệu não bộ cũng sử dụng loại phản hồi được cá nhân hóa đó hay không. Trong một nghiên cứu truy cập mở được công bố trên số ra ngày 25 tháng 2 của tạp chí Nature, các nhà nghiên cứu MIT báo cáo bằng chứng cho thấy não bộ thực sự làm như vậy.
Một nhóm nghiên cứu do Mark Harnett, một nhà điều tra của Viện Nghiên cứu Não bộ McGovern và phó giáo sư tại Khoa Khoa học Não bộ và Nhận thức tại MIT, dẫn đầu, đã phát hiện ra những tín hiệu hướng dẫn này ở chuột bằng cách huấn luyện động vật kiểm soát hoạt động của các neuron cụ thể bằng giao diện não-máy tính (BCI). Các nhà nghiên cứu cho biết, phương pháp tiếp cận của họ có thể được sử dụng để nghiên cứu sâu hơn về mối quan hệ giữa mạng thần kinh nhân tạo và não bộ thực, theo những cách được kỳ vọng sẽ cải thiện sự hiểu biết về học tập sinh học và cho phép trí tuệ nhân tạo lấy cảm hứng từ não bộ tốt hơn.
Bộ não đang thay đổi
Bộ não của chúng ta liên tục thay đổi khi chúng ta tương tác với thế giới, sửa đổi mạch điện của chúng khi chúng ta học hỏi và thích nghi. "Chúng ta biết rất nhiều từ 50 năm nghiên cứu rằng có nhiều cách để thay đổi sức mạnh của các kết nối giữa các neuron," Harnett nói. "Điều mà lĩnh vực này thực sự thiếu là một cách hiểu làm thế nào những thay đổi đó được sắp xếp để thực sự tạo ra quá trình học tập hiệu quả."
Một số hành động — và các kết nối thần kinh cho phép chúng — được củng cố bằng việc giải phóng các chất điều biến thần kinh như dopamine hoặc norepinephrine trong não. Nhưng những tín hiệu đó được truyền tới các nhóm lớn neuron, mà không phân biệt đóng góp riêng lẻ của tế bào vào một thất bại hoặc một thành công. "Học tăng cường thông qua chất điều biến thần kinh hoạt động, nhưng nó không hiệu quả, bởi vì tất cả các neuron và tất cả các synapse về cơ bản chỉ nhận được một tín hiệu," Harnett nói.
Học máy sử dụng một cách thay thế và cực kỳ mạnh mẽ để học hỏi từ những sai lầm. Sử dụng một phương pháp gọi là lan truyền ngược, mạng thần kinh nhân tạo tính toán một tín hiệu lỗi và sử dụng nó để điều chỉnh các kết nối riêng lẻ của chúng. Chúng làm điều này lặp đi lặp lại, học hỏi từ kinh nghiệm cách tinh chỉnh mạng lưới của chúng để thành công. "Nó hoạt động thực sự tốt và nó hiệu quả về mặt tính toán," Harnett nói.
Có vẻ như não bộ có thể sử dụng các tín hiệu lỗi tương tự để học tập. Nhưng các nhà thần kinh học đã hoài nghi rằng não bộ sẽ có độ chính xác để gửi các tín hiệu phù hợp cho từng neuron riêng lẻ, do những hạn chế áp đặt bằng cách sử dụng tế bào sống và mạch điện thay vì phần mềm và phương trình. Một vấn đề lớn để kiểm tra ý tưởng này là làm thế nào để tìm các tín hiệu cung cấp hướng dẫn cá nhân hóa cho các neuron, được gọi là tín hiệu hướng dẫn được vector hóa. Valerio Francioni, tác giả đầu tiên của bài báo trên tạp chí Nature và là một cựu nghiên cứu sinh sau tiến sĩ trong phòng thí nghiệm của Harnett, giải thích rằng thách thức là các nhà khoa học không biết các neuron riêng lẻ đóng góp như thế nào vào các hành vi cụ thể.
"Nếu tôi ghi lại hoạt động não của bạn khi bạn đang học chơi piano," Francioni giải thích, "tôi sẽ biết rằng có một mối tương quan giữa những thay đổi xảy ra trong não của bạn và việc bạn học piano. Nhưng nếu bạn yêu cầu tôi giúp bạn chơi piano giỏi hơn bằng cách thao túng hoạt động não của bạn, tôi sẽ không thể làm điều đó, bởi vì chúng ta không biết hoạt động của các neuron riêng lẻ ánh xạ đến hiệu suất cuối cùng đó như thế nào."
Nếu không biết neuron nào cần hoạt động nhiều hơn và neuron nào cần phải được kiểm soát, thì không thể tìm kiếm các tín hiệu chỉ đạo những thay đổi đó.
Hiểu chức năng neuron
Để giải quyết vấn đề này, nhóm của Harnett đã phát triển một nhiệm vụ giao diện não-máy tính để liên kết trực tiếp hoạt động thần kinh và kết quả phần thưởng — tương tự như liên kết các phím của đàn piano trực tiếp với hoạt động của các neuron đơn lẻ. Để thành công trong nhiệm vụ, một số neuron nhất định cần tăng hoạt động của chúng, trong khi những neuron khác được yêu cầu giảm hoạt động của chúng.
Họ đã thiết lập một BCI để liên kết trực tiếp hoạt động trong các neuron đó — chỉ 8 đến 10 trong số hàng triệu neuron trong não của chuột — với một kết quả đọc trực quan, cung cấp phản hồi cảm giác cho chuột về hiệu suất của chúng. Thành công đi kèm với việc cung cấp một phần thưởng có đường.
"Bây giờ nếu bạn hỏi tôi, 'Làm thế nào để chuột nhận được nhiều phần thưởng hơn? Bạn phải kích hoạt neuron nào và bạn phải ức chế neuron nào?' Tôi biết chính xác câu trả lời cho câu hỏi đó là gì," Francioni nói, người có công trình được hỗ trợ bởi Học bổng Y. Eva Tan từ Yang Tan Collective tại MIT.
Các nhà khoa học không biết chức năng chính xác của các neuron cụ thể mà họ liên kết với BCI, nhưng các tế bào đủ hoạt động để chuột nhận được phần thưởng thỉnh thoảng bất cứ khi nào các tín hiệu xảy ra đúng.
Góc nhìn từ cộng đồng
Hãy là người đầu tiên thêm một góc nhìn hữu ích để mạch đọc này trở nên sâu hơn.