Mona Lisa hoạt hình này được tạo ra bởi AI, và nó thật đáng sợ

Pin
Send
Share
Send

Nụ cười được vẽ đầy mê hoặc của "Mona Lisa" được biết đến trên toàn thế giới, nhưng khuôn mặt nổi tiếng gần đây đã thể hiện một loạt biểu cảm mới đáng kinh ngạc, lịch sự của trí tuệ nhân tạo (AI).

Trong một video được chia sẻ lên YouTube vào ngày 21 tháng 5, ba video clip cho thấy những ví dụ khó hiểu về Mona Lisa khi cô ấy di chuyển môi và quay đầu. Cô được tạo ra bởi một mạng lưới thần kinh tích chập - một loại AI xử lý thông tin giống như bộ não của con người, để phân tích và xử lý hình ảnh.

Các nhà nghiên cứu đã đào tạo thuật toán để hiểu các hình dạng chung của các đặc điểm khuôn mặt và cách chúng cư xử tương đối với nhau, sau đó áp dụng thông tin đó vào hình ảnh tĩnh. Kết quả là một chuỗi video thực tế về biểu cảm khuôn mặt mới từ một khung hình duy nhất.

Đối với các video Mona Lisa, AI "học" chuyển động khuôn mặt từ bộ dữ liệu của ba đối tượng người, tạo ra ba hình ảnh động rất khác nhau. Mặc dù mỗi trong số ba clip vẫn có thể nhận ra là Mona Lisa, các biến thể về ngoại hình và hành vi của các mô hình đào tạo đã cho mượn "tính cách" khác biệt với "chân dung sống", Egor Zakharov, một kỹ sư của Viện Khoa học và Công nghệ Skolkovo, và Trung tâm AI AI (cả hai đặt tại Moscow), được giải thích trong video.

Zakharov và các đồng nghiệp của ông cũng tạo ra hình ảnh động từ những bức ảnh của các biểu tượng văn hóa thế kỷ 20 như Albert Einstein, Marilyn Monroe và Salvador Dali. Các nhà nghiên cứu đã mô tả những phát hiện của họ, không được đánh giá ngang hàng, trong một nghiên cứu được công bố trực tuyến vào ngày 20 tháng 5 trên tạp chí arXiv.

Những khuôn mặt quen thuộc mang những biểu cảm lạ lẫm. (Tín dụng hình ảnh: E. Zakharov và cộng sự)

Sản xuất các video gốc như những video này, được gọi là deepfakes, không dễ dàng. Đầu người rất phức tạp về mặt hình học và rất năng động; Các mô hình 3D của đầu có "hàng chục triệu thông số", các tác giả nghiên cứu đã viết.

Hơn nữa, hệ thống thị giác của con người rất tốt trong việc xác định "những lỗi nhỏ" trong đầu người được mô hình 3D, theo nghiên cứu. Nhìn thấy thứ gì đó trông gần giống con người - nhưng không hoàn toàn - gây ra cảm giác khó chịu sâu sắc được gọi là hiệu ứng thung lũng kỳ lạ.

AI trước đây đã chứng minh rằng việc tạo ra các tác phẩm sâu có sức thuyết phục là có thể, nhưng nó đòi hỏi nhiều góc độ của đối tượng mong muốn. Đối với nghiên cứu mới, các kỹ sư đã giới thiệu AI với một bộ dữ liệu rất lớn các video tham chiếu cho thấy khuôn mặt của con người đang hoạt động. Các nhà khoa học đã thiết lập các mốc trên khuôn mặt sẽ áp dụng cho bất kỳ khuôn mặt nào, để dạy cho mạng lưới thần kinh cách các khuôn mặt hoạt động nói chung.

Sau đó, họ đã huấn luyện AI sử dụng các biểu thức tham chiếu để ánh xạ chuyển động của các tính năng của nguồn. Điều này cho phép AI tạo ra một hình ảnh sâu sắc ngay cả khi nó chỉ có một hình ảnh để làm việc, các nhà nghiên cứu báo cáo.

Và nhiều hình ảnh nguồn cung cấp một kết quả thậm chí chi tiết hơn trong hình ảnh động cuối cùng. Các video được tạo ra từ 32 hình ảnh, thay vì chỉ một, đã đạt được "chủ nghĩa hiện thực hoàn hảo" trong một nghiên cứu người dùng, các nhà khoa học viết.

Pin
Send
Share
Send