Saltar ao contido

Teoría do recoñecemento por compoñentes

Na Galipedia, a Wikipedia en galego.
Descomposición de obxectos en xeóns

A teoría do recoñecemento por compoñentes, ou teoría RBC,[1] é un proceso de arriba abaixo proposto por Irving Biederman en 1987 para explicar o recoñecemento de obxectos. Segundo a teoría RBC, somos capaces de recoñecer os obxectos separándoos en xeóns (as partes compoñentes principais do obxecto). Biederman suxeriu que os xeóns están baseados en formas tridimensionais básicas (cilindros, conos etc.) que se poden ensamblar en diversos arranxos para formar un número practicamente ilimitado de obxectos.[2]

A teoría do recoñecemento por compoñentes suxire que hai menos de 36 xeóns que se combinan para crear os obxectos que vemos no día a día.[3] Por exemplo, cando miramos unha cunca dividímola en dous compoñentes: "cilindro" e "asa". Isto tamén funciona para obxectos máis complexos, que á súa vez están formados por un maior número de xeóns. Os xeóns percibidos compáranse con obxectos da nosa memoria almacenada para identificar o que estamos a ver. A teoría propón que cando vemos obxectos buscamos dous compoñentes importantes.

  • Arestas: isto permítenos manter a mesma percepción do obxecto independentemente da orientación de visualización.
  • Concavidades: a zona onde se xuntan dous bordos. Isto permítenos observar a separación entre dous ou máis xeóns.

Analoxía entre fala e obxectos

[editar | editar a fonte]

Na súa proposta de RBC, Biederman fai unha analoxía coa composición da fala e dos obxectos que axuda a apoiar a súa teoría. A idea é que son necesarios uns 44 fonemas individuais ou "unidades de son" para compoñer todas as palabras na lingua inglesa e só se precisan uns 55 para compoñer todas as palabras en todos os idiomas. Aínda que poden existir pequenas diferenzas entre estes fonemas, aínda hai un número discreto que compón todas as linguas.

Pódese usar un sistema similar para describir como se perciben os obxectos. Biederman suxire que do mesmo xeito a fala está formada por fonemas, a percepción dos obxectos está formada por xeóns e, como hai unha gran varianza de fonemas, tamén hai unha gran varianza de xeóns. Compréndese máis facilmente como 36 xeóns poden compoñer a suma de todos os obxectos, cando a suma de toda a linguaxe e a fala humana está formada por só 55 fonemas.

Invarianza do punto de vista

[editar | editar a fonte]

Un dos factores máis definitorios da teoría do recoñecemento por compoñentes é que nos permite recoñecer obxectos independentemente do ángulo de visión; isto coñécese como invarianza do punto de vista. Proponse que a razón deste efecto son as propiedades invariantes do bordo dos xeóns.[4]

As propiedades de bordo invariantes son as seguintes:

  • Curvatura (varios puntos dunha curva)
  • Liñas paralelas (dous ou máis puntos que seguen a mesma dirección)
  • Co-terminación (o punto no que se atopan dous puntos e polo tanto deixan de continuar)
  • Simetría e asimetría
  • Co-linealidade (puntos que se ramifican a partir dunha liña común)

O noso coñecemento destas propiedades significa que ao ver un obxecto ou xeón, podemos percibilo desde case calquera ángulo. Por exemplo, ao ver un ladrillo poderemos ver conxuntos horizontais de liñas paralelas e verticais e ao considerar onde se xuntan estes puntos (co-terminación) somos capaces de percibir o obxecto.

Puntos fortes da teoría

[editar | editar a fonte]

Usar xeóns como primitivas estruturais resulta en dúas vantaxes clave. Debido a que os xeóns están baseados en propiedades dos obxectos que son estables entre o punto de vista ("invariante do punto de vista") e todos os xeóns son discriminables entre si, unha soa descrición de xeóns é suficiente para describir un obxecto desde todos os puntos de vista posibles. A segunda vantaxe é que se consegue unha considerable economía de representación: un conxunto relativamente pequeno de xeóns forman un simple "alfabeto" que pode combinarse para formar obxectos complexos. Por exemplo, con só 24 xeóns, hai 306.000 millóns de combinacións posibles de 3 xeóns, o que permite recoñecer todos os obxectos posibles.

Ademais, algunhas investigacións suxiren que a capacidade de recoñecer xeóns e estruturas compostas de xeóns pode desenvolverse no cerebro a partir dos catro meses de idade, o que o converte nunha das habilidades fundamentais que os bebés usan para percibir o mundo.[5]

Evidencia experimental

[editar | editar a fonte]
  • Os participantes mostran unha notable capacidade para recoñecer obxectos a pesar do ruído visual sempre que os xeóns sexan visibles.
  • A eliminación da información de relación de características (relacións entre xeóns) prexudica o recoñecemento de obxectos.
  • Non hai imprimación visual (visual primming) se se usan xeóns diferentes entre probas

Fraquezas

[editar | editar a fonte]

A teoría do RBC non é en si mesma capaz de comezar cunha fotografía dun obxecto real e producir unha descrición do obxecto de xeóns e relacións; a teoría non intenta proporcionar un mecanismo para reducir a complexidade das escenas reais a formas simples de xeóns. A teoría RBC tamén é incompleta porque os xeóns e as relacións entre eles deixarán de distinguir moitos obxectos reais. Por exemplo, unha pera e unha mazá distínguense facilmente polos humanos, pero carecen das esquinas e os bordos necesarios para que a teoría do RBC recoñeza que son diferentes. Non obstante, Irving Biederman argumentou que a teoría RBC é o modo "preferido" de recoñecemento de obxectos humanos, cun proceso secundario que trata obxectos que non se distinguen polos seus xeóns. Afirma ademais que esta distinción explica a investigación que suxire que os obxectos poden ou non ser recoñecidos igualmente ben con cambios no punto de vista.

  1. Sternberg, Robert J. (2006): Cognitive Psychology. 4th Ed. Thomson Wadsworth.
  2. Biederman, I. (1987) Recognition-by-components: a theory of human image understanding. Psychol Rev. 1987 Apr;94(2):115-147.
  3. Eyseneck, M W. Keane, M T, 2010. Cognitive Psychology: A Students Handbook. 6th Edition. Hove: Psychology Press
  4. Biederman, I. (2000). Recognizing depth-rotated objects: A review of recent research and theory Arquivado 28 de xuño de 2021 en Wayback Machine.. Spatial Vision, 13, 241–253.
  5. Haaf, R., Fulkerson, A., Jablonski, B., Hupp, J., Shull, S., Pescara-Kovach, L. (2003). Object recognition and attention to object components by preschool children and 4-month-old infants. Journal of Experimental Child Psychology, 86(2), 108-123.