Saltar ao contido

Transformador xerativo preadestrado

Na Galipedia, a Wikipedia en galego.
Transformador xerativo preadestrado
Wikidata

Un transformador xerativo pre-adestrado, do inglés generative pre-trained transformer (GPT), é un tipo de modelo de linguaxe grande (LLM)[1][2][3] que é amplamente utilizado en chatbots de intelixencia artificial xerativa.[4][5] Os GPT están baseados nunha arquitectura de aprendizaxe profunda chamada transformador. Están pre-adestrados en grandes conxuntos de datos de contido non etiquetado, e poden xerar novos contidos.[2][3]

OpenAI foi a primeira empresa en aplicar o generative pre-training (GP), adestramento previo xerativo, á arquitectura do transformador, introducindo o modelo GPT-1 en 2018.[6] Dende entón, a empresa lanzou moitos modelos GPT máis grandes. O popular chatbot ChatGPT, lanzado a finais de 2022 (usando GPT-3.5), foi seguido por moitos chatbots da competencia que usaron os seus propios modelos "GPT" para xerar texto, como Gemini, DeepSeek ou Claude.[7]

Os GPT úsanse principalmente para xerar texto, pero pódense adestrar para xerar outros tipos de datos. Por exemplo, GPT-4o pode procesar e xerar texto, imaxes e son.[8] Para mellorar o rendemento en tarefas complexas, algúns GPT, como OpenAI o3, dedican máis tempo a analizar o problema antes de xerar unha saída e denomínanse modelos de razoamento. En 2025, lanzouse GPT-5 cun router que selecciona automaticamente se se usa un modelo de razoamento máis rápido ou máis lento en función da tarefa.

  1. Haddad, Mohammed. "How does GPT-4 work and how can you start using it in ChatGPT?". Al Jazeera (en inglés). Consultado o 2025-09-20. 
  2. 2,0 2,1 "Generative AI: a game-changer society needs to be ready for". World Economic Forum (en inglés). Consultado o 2025-09-20. 
  3. 3,0 3,1 Perrigo, Billy. "The A to Z of Artificial Intelligence". TIME (en inglés). Consultado o 2025-09-20. 
  4. Hu, Luhui (2022-11-15). "Generative AI and Future". Medium (en inglés). Consultado o 2025-09-20. 
  5. "IEEE Computer Society". www.computer.org. Consultado o 2025-09-20. 
  6. "Improving language understanding with unsupervised learning". openai.com (en inglés). 2024-02-14. Consultado o 2025-09-20. 
  7. Ali, Fawad (2023-04-11). "GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared". MUO (en inglés). Consultado o 2025-09-20. 
  8. "OpenAI unveils GPT-4o, a fresh multimodal AI flagship model" (en inglés). Consultado o 2025-09-20.