Trí thông minh nhân tạo (AI) gần đây đã cố gắng tạo ra những bức ảnh mèo từ đầu, và kết quả thật đáng kinh ngạc.
Mạng lưới thần kinh đặc biệt này (một loại AI được mô phỏng theo hoạt động của bộ não con người) có thể tạo ra những bức ảnh gốc thực sự đáng kinh ngạc về khuôn mặt của con người. Trên thực tế, hình ảnh của những người trang điểm này gần như không thể phân biệt được với người xem hình ảnh của người thật, các lập trình viên của AI đã báo cáo trong một nghiên cứu được đăng vào tháng 12 năm 2018 trên tạp chí arXiv.
Felines, tuy nhiên, đã chứng minh là một câu chuyện khác. Thuật toán tương tự tạo ra khuôn mặt hoàn hảo của con người đã tạo ra những con mèo có đầu biến dạng; sai số mắt và chân; và các cơ thể quá dài, quá ngắn, quay tròn hoặc hình chữ nhật khác thường và uốn cong ở các góc độ khác thường.
Công cụ AI tạo ra những bức ảnh mèo đáng sợ là "kiến trúc máy phát dựa trên phong cách cho các mạng đối nghịch chung" hay StyleGAN. Các mạng như thế này là "nghịch cảnh" vì hai mô hình hoạt động đồng thời: Một mô hình tạo ra hình ảnh và một mô hình khác đánh giá kết quả so với ảnh trong tập dữ liệu huấn luyện, để mạng học hỏi từ những sai lầm của nó và cải thiện hiệu suất của nó, nghiên cứu cho biết.
Để AI tạo ra hình ảnh giống người thật, trước tiên, họ phải "tìm hiểu" khuôn mặt người trông như thế nào từ những bức ảnh hiện có. Thuật toán chia các khuôn mặt thành một danh sách kiểm tra các tính năng kiểu, chẳng hạn như vị trí đầu; giới tính; màu da; kết cấu tóc và phong cách; và hình dạng của mắt, mũi và miệng, các nhà nghiên cứu báo cáo.
Khi StyleGAN có thể nhận ra tất cả các yếu tố đó - mà không cần sự giám sát của con người - nó đã học cách lắp ráp chúng một cách độc lập để tạo ra một khuôn mặt hoàn toàn mới, chân thực như hình ảnh. Các nhà nghiên cứu đã từ chối yêu cầu phỏng vấn nhưng giải thích quy trình của họ trong một video được đăng lên Youtube vào ngày 12 tháng 12 năm 2018.
Vậy, tại sao StyleGAN không thể tạo ra những bức ảnh mèo thực tế đáng yêu? Thuật toán đã làm hết sức với những gì nó phải làm việc - và khi nói đến mèo, hàng ngàn hình ảnh tham khảo mà nó sử dụng không lý tưởng, Janelle Shane, một nhà nghiên cứu đào tạo mạng lưới thần kinh nhưng không tham gia vào nghiên cứu, nói với Khoa học trực tiếp.
Shane đã viết về những con mèo kỳ quái vào ngày 7 tháng 2 trên blog AI Weirdness của cô. Không giống như tập dữ liệu ảnh của StyleGAN về khuôn mặt người - trong đó cơ thể và hậu cảnh bị cắt xén và các vị trí đầu tương tự nhau - hình ảnh con mèo trong bộ dữ liệu rất khác nhau. Bộ sưu tập bao gồm các bức ảnh cận cảnh và ảnh rộng của mèo trong một loạt các cài đặt và chống lại các phông nền khác nhau. Một số bức ảnh cho thấy một con mèo, một số bao gồm nhiều con mèo và những người khác cũng bao gồm mọi người.
"Có những con mèo lộn ngược, có những con mèo cuộn tròn trong một quả bóng, đôi mắt của chúng mở ra, đôi mắt của chúng im lặng. Bạn chắc chắn có thể nói rằng dữ liệu đầu vào của chúng hơi ồn ào - và ồn ào, ý tôi là có những thứ trong đó đó không chỉ là hình ảnh của một con mèo, "Shane nói.
Vì vậy, đừng quá khó khăn với StyleGan vì sự hăm dọa kinh hoàng của những con mèo ác mộng.
"Có rất nhiều điều đang diễn ra mà thuật toán phải học", Shane nói thêm.
Mâu thuẫn thị giác khiến StyleGAN khó có thể học được một con mèo thực sự trông như thế nào. Và mạng lưới thần kinh không có bối cảnh trong thế giới thực cho thông tin họ cung cấp; tất cả những gì họ biết là những gì trong bộ dữ liệu của họ. StyleGAN đã học đủ từ các bức ảnh tham khảo để tái tạo chính xác các chi tiết và kết cấu quy mô nhỏ, như lông của mèo hoặc hình dạng của tai mèo. Nhưng chương trình rõ ràng đã vật lộn trong việc đưa toàn bộ con mèo lại với nhau, Shane nói.
"Mạng lưới thần kinh không hiểu mèo hoạt động như thế nào. Nó không hiểu chúng có bao nhiêu chân. Nó không thực sự rõ ràng về việc chúng có bao nhiêu mắt hoặc tất cả các giải phẫu của chúng đi đâu", cô nói với Live Science.
Xem thêm các bức ảnh mèo đáng lo ngại của StyleGAN, hình ảnh con người gần như hoàn hảo và các tệp dự án khác trên nền tảng phát triển GitHub.