Ficheiro:Graphique Zipf pour Ulysses.png

Os contidos da páxina non están dispoñibles noutras linguas.
Na Galipedia, a Wikipedia en galego.

Graphique_Zipf_pour_Ulysses.png(640 × 480 píxeles; tamaño do ficheiro: 4 kB; tipo MIME: image/png)

Resumo

Descrición
English: log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)
Français : graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)
Data
Orixe Obra propia
Autoría User: Xofc

Method

Using "Ulysses" by James Joyce found on http://www.gutenberg.org/etext/4300

PERL code:

#!/usr/bin/perl
while ($line = <STDIN>)
        {
        $line =~ tr/[A-Z]/[a-z]/;
        @WORDS_IN_LINE = split /\W+/, $line;
        for (@WORDS_IN_LINE)
                {
                $word_freq{$_}++
                }
        }
sub numeriquement { $b <=> $a; }
foreach $freq (sort numeriquement values %word_freq)
        {
        printf("%-5d %d\n", $i++, $freq);
        }

Or 'bash' code :

cat 4300-8.txt
|tr [A-Z] [a-z]|sed 's/[^a-z]/\n/g'|awk '/[a-z]/{print $1;}'|sort|uniq -c|awk '{print $1;}'|sort -rn|pr -n -t
# |tr "[A-Z]" "[a-z]"            # convert to lower cases
# |sed 's/[^a-z]/\n/g'       # one word per line : convert every non alpha by carriage_return
# |awk '/[a-z]/{print $1;}'  # forget empty lines
# |sort|uniq -c              # sort and count
# |awk '{print $1;}'         # just remember the count (forget the word)
# |sort -rn                  # sort numerically, descending order
# |pr -n -t                  # put a line number (=rank)
 
Esta PNG imaxe foi creada co Gnuplot.

Licenza

Eu, como posuidor dos dereitos de autor desta obra, pola presente publícoa baixo as seguintes licenzas:
GNU head Autorízase a copia, distribución e/ou modificación deste documento baixo os termos da licenza de documentación libre GNU, versión 1.2 ou calquera outra que posteriormente publique a Free Software Foundation; sen seccións invariables, textos de portada, nin textos de contraportada. Inclúese unha copia da devandita licenza na sección titulada GNU Free Documentation License.
w:gl:Creative Commons
recoñecemento compartir igual
This file is licensed under the Creative Commons Attribution-Share Alike 4.0 International, 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license.
Vostede é libre de:
  • compartir – copiar, distribuír e difundir a obra
  • facer obras derivadas – adaptar a obra
Baixo as seguintes condicións:
  • recoñecemento – Debe indicar a debida atribución de autoría, fornecer unha ligazón á licenza e indicar se se realizaron cambios. Pode facer isto de calquera forma razoable, mais non nunha forma que indique que quen posúe a licenza apoia ou subscribe o seu uso da obra.
  • compartir igual – Se altera, transforma ou amplía este contido, debe publicar as súas contribucións baixo a mesma licenza ou outra compatible á orixinal.
Pode seleccionar a licenza que desexe.

Pés de foto

Engada unha explicación dunha liña do representa este ficheiro

Elementos retratados neste ficheiro

representa a

Historial do ficheiro

Prema nunha data/hora para ver o ficheiro tal e como estaba nese momento.

Data/HoraMiniaturaDimensiónsUsuarioComentario
actual4 de outubro de 2009 ás 17:11Miniatura da versión ás 17:11 do 4 de outubro de 2009640 × 480 (4 kB)Xofc{{Information |Description={{en|1=log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)}} {{fr|1=graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)}} |Source=Own work by uploader

A seguinte páxina usa este ficheiro:

Uso global do ficheiro

Os seguintes wikis empregan esta imaxe: