AI có thể giải mã các từ trực tiếp từ sóng não

Pin
Send
Share
Send

Các nhà thần kinh học đang dạy máy tính đọc các từ thẳng ra khỏi bộ não của mọi người.

Kelly Servick, viết cho Khoa học, đã báo cáo trong tuần này về ba bài báo được đăng lên máy chủ in trước bioRxiv, trong đó ba nhóm nghiên cứu khác nhau đã chứng minh rằng họ có thể giải mã bài phát biểu từ các bản ghi của nơ-ron. Trong mỗi nghiên cứu, các điện cực được đặt trực tiếp lên não ghi lại hoạt động thần kinh trong khi bệnh nhân phẫu thuật não lắng nghe lời nói hoặc đọc thành tiếng. Sau đó, các nhà nghiên cứu đã cố gắng tìm ra những gì bệnh nhân đang nghe hoặc nói. Trong mỗi trường hợp, các nhà nghiên cứu có thể chuyển đổi hoạt động điện của não thành ít nhất là các tệp âm thanh dễ hiểu.

Bài báo đầu tiên, được đăng lên bioRxiv vào ngày 10 tháng 10 năm 2018, mô tả một thí nghiệm trong đó các nhà nghiên cứu đã phát các bản ghi âm lời nói cho bệnh nhân bị động kinh đang trong quá trình phẫu thuật não. (Các bản ghi thần kinh được thực hiện trong thí nghiệm phải được giải thích rất chi tiết. Và mức độ chi tiết đó chỉ khả dụng trong những trường hợp hiếm hoi khi não tiếp xúc với không khí và điện cực được đặt trực tiếp lên nó, chẳng hạn như trong phẫu thuật não .)

Khi các bệnh nhân nghe các tập tin âm thanh, các nhà nghiên cứu đã ghi lại các nơ-ron bắn vào các phần của bộ não của bệnh nhân xử lý âm thanh. Các nhà khoa học đã thử một số phương pháp khác nhau để biến dữ liệu bắn nơ-ron thành lời nói và thấy rằng "học sâu" - trong đó một máy tính cố gắng giải quyết vấn đề ít nhiều không được giám sát - hoạt động tốt nhất. Khi họ phát các kết quả thông qua một bộ phát âm, tổng hợp giọng nói của con người, đối với một nhóm gồm 11 người nghe, những cá nhân đó có thể diễn giải chính xác các từ 75 phần trăm thời gian.

Bạn có thể nghe âm thanh từ thí nghiệm này ở đây.

Bài báo thứ hai, được đăng vào ngày 27 tháng 11 năm 2018, dựa trên các bản ghi thần kinh từ những người trải qua phẫu thuật để loại bỏ khối u não. Khi các bệnh nhân đọc to những từ đơn âm tiết, các nhà nghiên cứu đã ghi lại cả âm thanh phát ra từ miệng của người tham gia và tế bào thần kinh bắn ra trong vùng sản xuất lời nói của não họ. Thay vì đào tạo máy tính sâu cho từng bệnh nhân, các nhà nghiên cứu này đã dạy một mạng lưới thần kinh nhân tạo để chuyển đổi các bản ghi thần kinh thành âm thanh, cho thấy kết quả ít nhất là dễ hiểu và tương tự như các bản ghi được tạo ra bởi micro. (Âm thanh từ thử nghiệm này có ở đây nhưng phải được tải xuống dưới dạng tệp zip.)

Bài viết thứ ba, được đăng vào ngày 9 tháng 8 năm 2018, dựa vào việc ghi lại phần não chuyển đổi những từ cụ thể mà một người quyết định nói thành chuyển động cơ bắp. Mặc dù không có bản ghi từ thí nghiệm này có sẵn trực tuyến, các nhà nghiên cứu báo cáo rằng họ có thể tái tạo lại toàn bộ câu (cũng được ghi lại trong khi phẫu thuật não cho bệnh nhân bị động kinh) và những người nghe câu có thể giải thích chính xác chúng theo nhiều lựa chọn kiểm tra (trong số 10 lựa chọn) 83 phần trăm thời gian. Phương pháp của thí nghiệm đó dựa vào việc xác định các mẫu liên quan đến việc tạo ra các âm tiết riêng lẻ, thay vì toàn bộ các từ.

Mục tiêu trong tất cả các thí nghiệm này là một ngày nào đó giúp những người mất khả năng nói (do chứng xơ cứng teo cơ bên cạnh hoặc các tình trạng tương tự) có thể nói thông qua giao diện máy tính với não. Tuy nhiên, khoa học cho ứng dụng đó chưa có.

Giải thích các mẫu thần kinh của một người chỉ tưởng tượng lời nói phức tạp hơn so với việc diễn giải các mẫu của một người nghe hoặc tạo ra lời nói, Science báo cáo. (Tuy nhiên, các tác giả của bài báo thứ hai nói rằng việc diễn giải hoạt động não của một người nào đó tưởng tượng lời nói có thể là có thể.)

Cũng cần lưu ý rằng đây là những nghiên cứu nhỏ. Bài báo đầu tiên dựa trên dữ liệu được lấy từ chỉ năm bệnh nhân, trong khi bài thứ hai nhìn vào sáu bệnh nhân và người thứ ba chỉ có ba người. Và không có bản ghi thần kinh nào kéo dài hơn một giờ.

Tuy nhiên, khoa học vẫn đang tiến về phía trước, và các thiết bị nói nhân tạo được nối trực tiếp vào não dường như là một khả năng thực sự tại một số điểm trên đường.

Pin
Send
Share
Send