Lei de Zipf

Na Galipedia, a Wikipedia en galego.

A Lei de Zipf, formulada na década de 1940 por George Kingsley Zipf, lingüista da Universidade Harvard, na súa obra Human Behaviour and the Principle of Least-Effort ("Comportamento Humano e o Principio do Menor Esforzo"), é unha lei empírica que rexe a dimensión, importancia ou frecuencia dos elementos dunha lista ordenada[1][2]. Trátase dunha lei de potencias sobre a distribución de valores de acordo co número da orde nunha lista. Nunha lista, o membro n tería unha relación de valor con respecto ao primeiro membro da lista segundo 1/n. Por exemplo, nunha lingua a frecuencia coa que aparecen as diversas palabras segue unha distribución que se pode aproximar por:

P_n \sim 1/n^a

onde Pn representa a frecuencia dunha palabra ordenada na enésima posición e o expoñente a é próximo á unidade. Isto significa que o segundo elemento se repetirá aproximadamente cunha frecuencia que é metade da do primeiro, e o terceiro elemento cunha frecuencia de 1/3 e así sucesivamente. Unha lei non empírica, pero máis precisa, derivada dos traballos de Claude Shannon, foi descuberta por Benoît Mandelbrot.

Os campos de aplicación da lei de Zipf son diversos, e son tamén varias as tendencias de pensamento que a teñen proposto como contrapartida á distribución gausiana no ámbito das ciencias sociais. Na realidade, nas ciencias sociais non se segue sempre unha distribución gaussiana, mais tampouco se segue sempre a lei de Zipf.

Xénese[editar | editar a fonte]

Frecuencia das palabras en función da orde na versión orixinal de Ulises de James Joyce.

Zipf analizou a obra monumental de James Joyce, Ulises, e contou as palabras distintas, ordenándoas por frecuencia. Verificouse que:

  • a palabra máis común aparecía 8.000 veces;
  • a décima, 800 veces;
  • a centésima, 80 veces;
  • a milésima, 8 veces.

Notas[editar | editar a fonte]

Véxase tamén[editar | editar a fonte]

Ligazóns externas[editar | editar a fonte]