Xeón (psicoloxía)

Na Galipedia, a Wikipedia en galego.

Os xeóns son as formas simples planas ou volumétricas (en 2D ou 3D) como cilindros, ladrillos, cuñas, conos, círculos e rectángulos correspondentes ás partes simples dun obxecto na teoría do recoñecemento por compoñentes de Biederman.[1] A teoría propón que a entrada visual é equiparada a representacións estruturais de obxectos no cerebro. Estas representacións estruturais consisten en xeóns e as súas relacións (por exemplo, un cono de xeado podería dividirse nunha esfera situada sobre un cono). Só se supón un número modesto de xeóns (<40). Cando se combinan en diferentes relacións entre si (por exemplo, encima de, maior que, de extremo a extremo, de extremo a medio) e variación métricas grosas como a relación de aspecto e a orientación 2D, pódense xerar miles de millóns de posibles obxectos compostos dos xeóns básicos 2D e 3D. Dúas clases de identificación visual baseada na forma que non se fan a través de representacións de xeóns son as que interveñen en:

a) distinguir entre caras similares

b) clasificacións que non teñen límites definidos, como a de arbustos ou unha prenda arrugada.

Normalmente, estas identificacións non son invariantes desde o punto de vista.

Propiedades dos xeóns[editar | editar a fonte]

Dous casos de dous xeóns interrelacionados, que imaxina o lector en cada caso?

Hai 4 propiedades esenciais dos xeóns:

  1. Invarianza de visualización: cada xeón pódese distinguir dos demais desde case todos os puntos de vista, excepto por "accidentes" en ángulos moi restrinxidos nos que un xeón proxecta unha imaxe que podería ser un xeón diferente, como, por exemplo, cando unha vista final dun cilindro pode ser unha esfera ou un círculo. Os obxectos representados como unha disposición de xeóns serían, do mesmo xeito, invariantes no punto de vista.
  2. Estabilidade ou resistencia ao ruído visual: Debido a que os xeóns son simples, son facilmente soportados pola propiedade Gestalt de continuidade suave, facendo que a súa identificación sexa robusta ata a oclusión parcial e a degradación por ruído visual como, por exemplo, cando un cilindro pode verse detrás dun mato.
  3. Invarianza á dirección de iluminación e marcas superficiais e textura.
  4. Alta distintividade: os xeóns difiren cualitativamente, con só dous ou tres niveis de atributos, como curvatura recta contra curva, paralela contra non paralela, positiva contra negativa. Estas diferenzas cualitativas pódense distinguir facilmente facendo así que os xeóns sexan facilmente distinguibles e os obxectos tan compostos, facilmente distinguibles.

Derivación de propiedades invariantes de xeóns[editar | editar a fonte]

Invarianza do punto de vista: a invarianza do punto de vista dos xeóns deriva de que se distinguen por tres propiedades non accidentais (non accidental properties, NAP) de contornos que non cambian coa orientación en profundidade:

  1. Se o contorno é recto ou curvo,
  2. O vértice que se forma cando dous ou tres contornos se coerminan (é dicir, rematan xuntos no mesmo punto), na imaxe, é dicir, un L (2 contornos), unha bifurcación (3 contornos con todos os ángulos <180 °) ou un frecha (3 contornos, cun ángulo> 180 °) e
  3. Se un par de contornos é paralelo ou non (con perspectiva para a perspectiva). Cando non son paralelos, os contornos poden ser rectos (converxentes ou diverxentes) ou curvados, cunha curvatura positiva ou negativa formando unha envolvente convexa ou cóncava, respectivamente (ver figura a continuación).

Os NAP pódense distinguir das propiedades métricas (metrical properties, MP), como o grao de curvatura non nula dun contorno ou a súa lonxitude, que varían cos cambios de orientación en profundidade.

Invarianza á dirección da iluminación e ás características da superficie[editar | editar a fonte]

Os xeóns pódense determinar a partir dos contornos que marcan os bordos na descontinuidade de orientación e profundidade dunha imaxe dun obxecto, é dicir, os contornos que especifican un bo debuxo en liña da forma ou volume do obxecto. As descontinuidades de orientación definen aqueles bordos nos que hai un forte cambio na orientación do normal cara á superficie dun volume, como ocorre no contorno nos límites dos diferentes lados dun ladrillo. Unha descontinuidade de profundidade é onde a liña de visión do observador salta desde a superficie dun obxecto até o fondo (é dicir, é tanxente á superficie), como ocorre nos lados dun cilindro. O mesmo contorno pode marcar tanto unha orientación como unha descontinuidade de profundidade, como ocorre co bordo traseiro dun ladrillo. Debido a que os xeóns están baseados nestas descontinuidades, son invariantes ás variacións na dirección da iluminación, as sombras e a textura e marcas da superficie.

Xeóns e conos xeneralizados[editar | editar a fonte]

Os xeóns constitúen unha partición do conxunto de conos xeneralizados,[2] que son os volumes creados cando unha sección transversal é varrida ao longo dun eixe. Por exemplo, un círculo varrido ao longo dun eixe recto definiría un cilindro (ver Figura). Un rectángulo varrido ao longo dun eixe recto definiría un "ladrillo" (ver Figura). Catro dimensións con valores contrastivos (é dicir, valores mutuamente excluíntes) definen o conxunto actual de xeóns (ver Figura):

  1. Forma da sección transversal: redondo vs. recto. Por exemplo, como se indicou anteriormente, un rectángulo varrido ao longo dun eixo recto definiría un "ladrillo" e a sección transversal sería recta.
  2. Eixo: recto vs. curvo.
  3. Tamaño da sección transversal ao ser varrida ao longo dun eixo: constante fronte a expansión (ou contraída) vs. O tamaño da sección transversal dun "ladrillo" sería constante.
  4. Terminación de xeon con seccións transversais de tamaño constante: truncado vs. converxente a un punto vs. redondeado.

Estas variacións na xeración de xeóns crean formas que difiren nos NAP.

Probas experimentais da invarianza do punto de vista dos xeóns[editar | editar a fonte]

Agora hai un apoio considerable para os principais supostos da teoría dos xeóns (véxase Teoría do recoñecemento por compoñentes). Un problema que xerou algunha discusión foi o descubrimento[3] que os xeóns eran invariantes desde o punto de vista con pouco ou ningún custo na velocidade ou precisión de recoñecer ou coincidir un xeón a partir dunha orientación en profundidade non experimentada anteriormente. Algúns estudos[4] informaron de custos modestos na combinación de xeóns en novas orientacións en profundidade, pero estes estudos presentaron varias carencias metodolóxicas.[5][6]

Investigación sobre xeóns[editar | editar a fonte]

Hai moitas investigacións sobre os xeóns e como se interpretan. Un estudo importante está a suceder agora é un dos que está a ver como a revolta dos xeóns afecta o recoñecemento de imaxes nas pombas. Kim Kirkpatrick-Steger, Edward A. Wasserman e Irving Biederman están realizando esta investigación e descubriron que os xeóns individuais xunto coa súa composición espacial son importantes como recoñecemento.[7] Ademais, os achados desta investigación parecen indicar que a sensibilidade non accidental pódese atopar en todas as especies discriminadoras de forma.[8]

Notas[editar | editar a fonte]

  1. Biederman, Irving (1987). "Recognition-by-components: A theory of human image understanding" (PDF). Psychological Review 94 (2): 115–47. PMID 3575582. doi:10.1037/0033-295X.94.2.115. 
  2. Nevatia, R. (1982) Machine Perception. Prentice-Hall.
  3. Biederman, Irving; Gerhardstein, Peter C. (1993). "Recognizing depth-rotated objects: Evidence and conditions for three-dimensional viewpoint invariance" (PDF). Journal of Experimental Psychology: Human Perception and Performance 19 (6): 1162–82. PMID 8294886. doi:10.1037/0096-1523.19.6.1162. 
  4. Tarr, Michael J.; Williams, Pepper; Hayward, William G.; Gauthier, Isabel (1998). "Three-dimensional object recognition is viewpoint dependent". Nature Neuroscience 1 (4): 275–7. PMID 10195159. doi:10.1038/1089. 
  5. Biederman, I; Bar, M (1999). "One-shot viewpoint invariance in matching novel objects". Vision Research 39 (17): 2885–99. PMID 10492817. doi:10.1016/S0042-6989(98)00309-5. 
  6. Dill, Marcus; Edelman, Shimon (2001). "Imperfect invariance to object translation in the discrimination of complex shapes". Perception 30 (6): 707–24. PMID 11464559. doi:10.1068/p2953. 
  7. Biederman, Irving; Kirkpatrik-Steger, Kim; Wasserman, Edward (1998). "Effects of Geon Deletion, Scrambling, and Movement on Picture Recognition in Pigeons". Journal of Experimental Psychology: Animal Behavior Processes 24 (1): 34–46. PMID 9438964. doi:10.1037/0097-7403.24.1.34. 
  8. Biederman, Irving; Kirkpatrik-Steger, Kim; Wasserman, Edward (1998). "Effects of Geon Deletion, Scrambling, and Movement on Picture Recognition in Pigeons". Journal of Experimental Psychology: Animal Behavior Processes 24 (1): 34–46. PMID 9438964. doi:10.1037/0097-7403.24.1.34.