iCrowdNewswire Spanish

Debilidad clave en sistemas de visión de ordenador moderno identificado

Jul 31, 2018 6:00 AM ET

Los equipos son grandes en la categorización de imágenes de los objetos hallados con ellos, pero son sorprendentemente mal averiguar cuando dos objetos en una sola imagen son iguales o diferentes entre sí. Nueva investigación ayuda a mostrar por qué la tarea es tan difícil para los algoritmos de visión de ordenador moderno.

Fotografía: Laboratorio Serre / Brown University

Algoritmos de visión han recorrido un largo camino en la última década. Has demostrados ser como bueno o mejor que las personas en tareas como clasificar perros o razas de gatos, y tienen la notable capacidad para identificar específico enfrenta un mar de millones.

Pero la investigación realizada por científicos de la Universidad de Brown muestra que equipos fallan miserablemente en una clase de tareas que incluso los niños pequeños no tienen ningún problema con: determinar si dos objetos de una imagen son iguales o diferentes. En un documento presentado la semana pasada en la reunión anual de la sociedad de ciencia cognitiva, el equipo marrón arroja luz sobre por qué ordenadores son tan malos en este tipo de tareas y sugiere avenidas hacia sistemas de visión de computadora más inteligentes.

“Hay mucho entusiasmo sobre qué visión de la computadora ha sido capaz de lograr, y comparto mucho de eso,” dijo Thomas Serre, profesor de ciencias cognitivas, lingüísticas y psicológicas de Brown y autor principal del libro. «Pero pensamos que trabajando comprender las limitaciones de los sistemas de visión de computadora actuales, como lo hemos hecho aquí, realmente podemos avanzar hacia nuevos, más sistemas avanzados en lugar de simplemente afinando los sistemas que ya tenemos».

Para el estudio, Serre y sus colegas usaron algoritmos de visión de computadora de vanguardia para analizar imágenes en blanco y negro simple que contiene dos o más formas generadas al azar. En algunos casos los objetos eran idénticos; a veces eran lo mismo pero con un objeto que gira en relación con el otro; a veces los objetos eran completamente diferentes. El equipo se le pidió identificar la relación igual o diferente.

El estudio demostró que, incluso después de cientos de miles de ejemplos de entrenamiento, los algoritmos eran no mejores que chance al reconocimiento de la relación adecuada. La pregunta, entonces, fue por eso que estos sistemas son tan malos en esta tarea.

Serre y sus colegas tenían la sospecha que tiene algo que ver con la incapacidad de estos algoritmos de visión de computadora de individuate objetos. Cuando ordenadores miran una imagen, ella puede saber realmente donde un objeto en las paradas de la imagen y el fondo u otro objeto, comienza. Sólo ven un conjunto de píxeles que tienen patrones similares a las colecciones de píxeles que han aprendido a asociar ciertas etiquetas. Funciona bien para problemas de identificación o clasificación, pero cae aparte cuando se trata de comparar dos objetos.

Para demostrar que éste era de hecho por qué los algoritmos fueron rompiendo, Serre y su equipo realizaron experimentos que relevaron el ordenador tengan que individualiza los objetos de su propio. En lugar de mostrar los objetos de equipo dos en la misma imagen, los investigadores mostraron la computadora los objetos uno por uno en imágenes distintas. Los experimentos demostraron que los algoritmos no tenían ningún problema de aprendizaje relación igual o diferente siempre y cuando no tienen que ver los dos objetos de la misma imagen.

La fuente del problema en individualizadora objetos, Serre, dice, es la arquitectura de la máquina sistemas que los algoritmos de aprendizaje. Los algoritmos utilizan redes neuronales convolucionales–capas de unidades de procesamiento conectadas que imitan libremente redes de neuronas en el cerebro. Una diferencia clave del cerebro es que las redes artificiales son exclusivamente “feed-forward” – significado de la información tiene un flujo unidireccional a través de las capas de la red. Funciona no como el sistema visual en los seres humanos, según Serre.

“Si nos fijamos en la anatomía del sistema visual, encontrará que hay un montón de conexiones recurrentes, donde la información va de un área visual mayor a una menor área visual y a través”, dijo Serre.

Aunque no está claro exactamente lo que hacen esos votos, Serre, dice, es probable que tengan algo que ver con nuestra capacidad de prestar atención a ciertas partes de nuestro campo visual y hacer representaciones mentales de los objetos en nuestra mente.

“Probablemente personas asisten a un objeto, construyendo una representación de la función que está destinada a ese objeto en la memoria de trabajo,” dijo Serre. “Entonces cambian su atención hacia otro objeto. Cuando ambos objetos están representados en la memoria de trabajo, su sistema visual es capaz de hacer comparaciones como igual o diferente. “

Serre y sus colegas la hipótesis de que la razón las computadoras no pueden hacer nada como eso es porque las redes neuronales de feed-forward no permiten la clase de la elaboraciones recurrente para esta individualización y la representación mental de objetos. Podría ser, dice Serre, que haciendo más inteligente visión artificial requieren redes neuronales que se aproximan más a la naturaleza recurrente de procesamiento visual humano.

See Campaign: https://www.sciencedaily.com/releases/2018/07/180730132938.htm
Contact Information:
Brown University

Tags:
, Wire, Artificial Intelligence Newswire, United States, Spanish

Haga clic aquí para más información

Keywords: afds, afdsafds

Tags: News