Corpus de Referencia do Galego Actual

Na Galipedia, a Wikipedia en galego.

O Corpus de Referencia do Galego Actual (CORGA) é unha colección de documentos que se almacenan en formato electrónico na que están representados os diferentes tipos de textos da lingua galega actual (xornalísticos, literarios etc.). Cronoloxicamente comprende textos publicados dende 1975, e dispón de 25 millóns de formas.

A amplitude de documentos dos que consta, así como os criterios empregados na súa selección, permite considerar este corpus representativo do uso lingüístico do galego actual. O acceso é gratuíto, pero é necesario rexistrarse.


A actual versión creouse coa finalidade de adecuar o corpus existente ás tecnoloxías actuais e posibilitar un sistema de recuperación de información máis flexible e efectivo que o existente, polo que se levou a cabo unha reestruturación da base documental seguindo o estándar XML (eXtensible Markup Language).

Véxase tamén[editar | editar a fonte]

Outros artigos[editar | editar a fonte]

Ligazóns externas[editar | editar a fonte]