Imágenes manipuladas pueden engañar a la máquina de visión y también a los seres humanos

Nuevas investigaciones indican que los ligeros cambios en imágenes digitales, diseñados para confundir sistemas de visión artificial, también pueden afectar la percepción humana. Los ordenadores y humanos veen el mundo de manera diferente. Nuestros sistemas biológicos y los artificiales pueden no estar atentos a las mismas señales visuales. Las redes neuronales capacitadas para clasificar imágenes pueden ser completamente confundidas por perturbaciones sutiles en una imagen que un humano no notaría.

La posibilidad de que los sistemas de IA sean engañados por contradicciones sugiere una diferencia fundamental entre la percepción humana y la de la máquina, pero nos llevó a explorar si los humanos también podrían ser influenciados por tales perturbaciones bajo condiciones controladas. En una serie de experimentos publicados en Nature Communications, encontramos evidencia de que las decisiones humanas están influenciadas sistemáticamente por tales perturbaciones. Nuestro descubrimiento resalta la similitud entre la visión humana y la de la máquina, pero también demuestra la necesidad de más investigación para entender cómo influyen las imágenes contradictorias en las personas, así como los sistemas de IA. En este estudio, investigamos si las perturbaciones en una imagen pueden influir en la percepción humana. Para ello, realizamos experimentos controlados en los que presentamos a los participantes un par de imágenes y les hicimos preguntas específicas sobre ellas. Por ejemplo, mostramos al modelo una imagen original clasificada como un vaso y luego le presentamos ataques a la misma imagen que fueron mal clasificados con alta confianza como gato o camión. A los participantes humanos les preguntamos cual de las dos imágenes era el vaso, aunque ninguna imagen se parecía en nada a un gato. Hemos encontrado que la tasa de elección está fiablemente por encima de lo que esperaríamos si las activaciones cerebrales no son insensibles a los ataques sutiles contradictorios. Esto nos muestra que la percepción humana puede verse afectada, aunque sutilmente, por imágenes contradictorias. Nuestros hallazgos plantean preguntas críticas para la investigación de seguridad en IA y nos ayudarán a construir sistemas de IA más robustos alineándolos mejor con la visión humana. Medir la susceptibilidad humana a las perturbaciones conflictivas puede ayudar a evaluar su alineación para una variedad de arquitecturas de visión computacional. Nuestro trabajo también muestra la importancia de investigar más en profundidad los efectos de las tecnologías no solo en las máquinas, sino también en los seres humanos. Esto subraya la continua relevancia de la ciencia cognitiva y la neurociencia para comprender mejor los sistemas de IA y sus posibles impactos mientras construimos sistemas más seguros y confiables.

Video

Tags

    There are no post in the library.