Procesamento da linguaxe natural: Diferenzas entre revisións

Na Galipedia, a Wikipedia en galego.
Contido eliminado Contido engadido
Maañón (conversa | contribucións)
Sen resumo de edición
Correccións da lingua
Liña 1: Liña 1:
O '''Procesamento da Linguaxe Natural''', (''PLN'', ou ''NLP''; ''Natural Language Processing''), é unha subdisciplina da [[intelixencia artificial]] e unha das aplicacións máis útiles da [[lingüística computacional]]. O '''PLN''' ocúpase da formulación e investigación de mecanismos eficaces computacionalmente para a comunicación entre persoas ou entre personas e máquinas por medio de [[linguaxe natural]]. O '''PLN''' non trata dea comunicación por medio de linguaxes naturais dunha forma abstracta, senon de deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que se podan realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados enfócanse non só á comprensión da linguaxe de por , senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural sirve so de medio para estudiar estos fenómenos.
O '''Procesamento da Linguaxe Natural''' (''PLN'', ou ''NLP''; ''Natural Language Processing'') é unha subdisciplina da [[intelixencia artificial]] e unha das aplicacións máis útiles da [[lingüística computacional]]. O '''PLN''' ocúpase da formulación e investigación de mecanismos eficaces computacionalmente para a comunicación entre persoas ou entre persoas e máquinas por medio de [[linguaxe natural]]. O '''PLN''' non trata da comunicación por medio de linguaxes naturais dunha forma abstracta, senon que procura deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que se poidan realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados enfócanse non só á comprensión da linguaxe de por si, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural serve de medio para estudar estes fenómenos.


==Historia==
==Historia==
O '''Procesamiento da Linguaxe Natural (PLN)''' é unha das pedras angulares tempranas da [[intelixencia artificial]] (IA). A [[Tradución Automática]], por exemplo, naceu a fins da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o '''PLN''' desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro deste campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Os primeiros intentos de traducir textos por ordenador a fins dos anos corenta e durante os cincuenta fracasaron debido á escasa potencia dos ordenadores e á escasa sofistificación lingüística. Sen embargo, os esforzos realizados nas décadas dos sesenta e os setenta para producir interfaces en linguaxe natural para bases de datos e outras aplicacions informáticas obtiveron un cierto grao significativo de éxito. A década dos oitenta e a principios dos noventa veu rexurdir a investigación no terreo da Traducción Automática.
O '''Procesamiento da Linguaxe Natural (PLN)''' é unha das pedras angulares temperás da [[intelixencia artificial]] (IA). A [[Tradución Automática]], por exemplo, naceu a fins da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o '''PLN''' desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro deste campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Os primeiros intentos de traducir textos por ordenador a fins dos anos corenta e durante os cincuenta fracasaron debido á escasa potencia dos ordenadores e á escasa sofistificación lingüística. Porén, os esforzos realizados nas décadas dos sesenta e os setenta para producir interfaces en linguaxe natural para bases de datos e outras aplicacions informáticas obtiveron un certo grao significativo de éxito. A década dos oitenta e a principios dos noventa veu rexurdir a investigación no terreo da Tradución Automática.


==Dificultades no procesamiento de linguaxes naturais==
==Dificultades no procesamento de linguaxes naturais==
===Ambigüedade===
===Ambigüidade===
A linguaxe natural es inherentemente ambiguo a diferentes niveis:
A linguaxe natural é inherentemente ambigua a diferentes niveis:


* A nivel [[léxico]], unha mesma palabra pode tener varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do '''procesamento de linguaxes naturais''' teñen estudado métodos de resolver as ambigüedades léxicas mediante dicionarios, gramáticas, bases do coñecemento e correlacións estadísticas.
* A nivel [[léxico]], unha mesma palabra pode ter varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do '''procesamento de linguaxes naturais''' teñen estudado métodos de resolver as ambigüidades léxicas mediante dicionarios, gramáticas, bases do coñecemento e correlacións estatísticas.
* A nivel referencial, a resolución de [[anáfora]s] e [[catáforas]]s implica determinar a entidade lingüística previa ou posterior a que fan referencia.
* A nivel referencial, a resolución de [[anáfora]s] e [[catáforas]]s implica determinar a entidade lingüística previa ou posterior á que fan referencia.
* A nivel estructural, requirese da [[semántica]] para desambiguar a dependencia dos sintagmas preposicionais que conducen á construción de distintas [[árbore sintáctica|árbores sintácticas]].
* A nivel estrutural, requírese da [[semántica]] para desambiguar a dependencia dos sintagmas preposicionais que conducen á construción de distintas [[árbore sintáctica|árbores sintácticas]].
* A nivel pragmático, unha oración, a miudo, non significa o que realmente estase a dicir. Elementos tales como a [[Figura retórica|ironía]] teñen un papel importante na interpretación da mensaxe.
* A nivel pragmático, unha oración, a miudo, non significa o que realmente se está a dicir. Elementos tales como a [[Figura retórica|ironía]] teñen un papel importante na interpretación da mensaxe.


Para resolver estes tipos de ambigüedades e outros, o problema central no '''PLN''' é tradución de entradas en linguaxe natural a unha representación interna sin ambigüedade, como [[árbore sintáctica|árbores de análise]].
Para resolver estes tipos de ambigüidades e outros, o problema central no '''PLN''' é tradución de entradas en linguaxe natural a unha representación interna sen ambigüedade, como [[árbore sintáctica|árbores de análise]].


===Detección de separación entre as palabras===
===Detección de separación entre as palabras===
Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o [[idioma chino mandarín|chino mandarín]] tampouco teñen separacións entre as palabras.
Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o [[idioma chinés mandarín|chinés mandarín]] tampouco teñen separacións entre as palabras.


===Recepción imperfecta de datos===
===Recepción imperfecta de datos===
Acentos extranxeros, rexionalismos ou dificultades na producción da fala, errores de mecanografiado ou expresións non gramaticais, errores na lectura de textos mediante [[OCR]]
Acentos estranxeros, rexionalismos ou dificultades na produción da fala, erros de mecanografado ou expresións non gramaticais, erros na lectura de textos mediante [[OCR]]


==Compoñentes==
==Compoñentes==
*[[Morfoloxía_lingüística|Análise morfolóxica]]
*[[Morfoloxía_lingüística|Análise morfolóxica]]
A análise das palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestas e outros fenómenos.
A análise das palabras para extraer raíces, rasgos flexivos, unidades léxicas compostas e outros fenómenos.
*[[Sintaxis|Análise sintáctica]]
*[[Sintaxe|Análise sintáctica]]
A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.
A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.
*[[Semántica|Análise semántica]]
*[[Semántica|Análise semántica]]
A extracción do significado da frase, e a resolución de ambigüedades léxicas e estructurais.
A extracción do significado da frase, e a resolución de ambigüidades léxicas e estruturais.
*[[Pragmática|Análise pragmática]]
*[[Pragmática|Análise pragmática]]
A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.
A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.
*Planificación da frase
*Planificación da frase
Estrucurar cada frase do texto co fin de expresar o significado adecuado.
Estruturar cada frase do texto co fin de expresar o significado adecuado.
*Xeración da frase
*Xeración da frase
A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, coas súas correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.
A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, coas súas correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.

==Aplicacións==
==Aplicacións==
As principais tarefas de traballo na área do '''PLN''' son:
As principais tarefas de traballo na área do '''PLN''' son:
*[[Síntesis do discurso]]
*[[Síntese do discurso]]
*[[Análisis da lenguaxe]]
*[[Análise da linguaxe]]
*[[Comprensión da linguaxe]]
*[[Comprensión da linguaxe]]
*[[Recoñecemento da fala]]
*[[Recoñecemento da fala]]
*[[Traducción automática]]
*[[Tradución automática]]
*[[Extracción de información]]
*[[Extracción de información]]



Revisión como estaba o 22 de agosto de 2007 ás 19:03

O Procesamento da Linguaxe Natural (PLN, ou NLP; Natural Language Processing) é unha subdisciplina da intelixencia artificial e unha das aplicacións máis útiles da lingüística computacional. O PLN ocúpase da formulación e investigación de mecanismos eficaces computacionalmente para a comunicación entre persoas ou entre persoas e máquinas por medio de linguaxe natural. O PLN non trata da comunicación por medio de linguaxes naturais dunha forma abstracta, senon que procura deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que se poidan realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados enfócanse non só á comprensión da linguaxe de por si, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural serve só de medio para estudar estes fenómenos.

Historia

O Procesamiento da Linguaxe Natural (PLN) é unha das pedras angulares temperás da intelixencia artificial (IA). A Tradución Automática, por exemplo, naceu a fins da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o PLN desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro deste campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Os primeiros intentos de traducir textos por ordenador a fins dos anos corenta e durante os cincuenta fracasaron debido á escasa potencia dos ordenadores e á escasa sofistificación lingüística. Porén, os esforzos realizados nas décadas dos sesenta e os setenta para producir interfaces en linguaxe natural para bases de datos e outras aplicacions informáticas obtiveron un certo grao significativo de éxito. A década dos oitenta e a principios dos noventa veu rexurdir a investigación no terreo da Tradución Automática.

Dificultades no procesamento de linguaxes naturais

Ambigüidade

A linguaxe natural é inherentemente ambigua a diferentes niveis:

  • A nivel léxico, unha mesma palabra pode ter varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do procesamento de linguaxes naturais teñen estudado métodos de resolver as ambigüidades léxicas mediante dicionarios, gramáticas, bases do coñecemento e correlacións estatísticas.
  • A nivel referencial, a resolución de [[anáfora]s] e catáforass implica determinar a entidade lingüística previa ou posterior á que fan referencia.
  • A nivel estrutural, requírese da semántica para desambiguar a dependencia dos sintagmas preposicionais que conducen á construción de distintas árbores sintácticas.
  • A nivel pragmático, unha oración, a miudo, non significa o que realmente se está a dicir. Elementos tales como a ironía teñen un papel importante na interpretación da mensaxe.

Para resolver estes tipos de ambigüidades e outros, o problema central no PLN é tradución de entradas en linguaxe natural a unha representación interna sen ambigüedade, como árbores de análise.

Detección de separación entre as palabras

Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o chinés mandarín tampouco teñen separacións entre as palabras.

Recepción imperfecta de datos

Acentos estranxeros, rexionalismos ou dificultades na produción da fala, erros de mecanografado ou expresións non gramaticais, erros na lectura de textos mediante OCR

Compoñentes

A análise das palabras para extraer raíces, rasgos flexivos, unidades léxicas compostas e outros fenómenos.

A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.

A extracción do significado da frase, e a resolución de ambigüidades léxicas e estruturais.

A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.

  • Planificación da frase

Estruturar cada frase do texto co fin de expresar o significado adecuado.

  • Xeración da frase

A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, coas súas correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.

Aplicacións

As principais tarefas de traballo na área do PLN son:

Véxase tamén

Ligazóns externas

Referencias