Cómo ajustar tu propio modelo de lenguaje generativo

¿Has oído hablar de GPT2, GPT3 u OPT? Estos son algunos de los modelos generativos de lenguaje más conocidos y utilizados a día de hoy, con aplicaciones en múltiples ámbitos como chatbots, question answering o autocompleción, entre otros.

La generación del lenguaje natural es uno de los subcampos del PLN que más ha evolucionado en los últimos años gracias a los grandes volúmenes de datos disponibles y al aumento en la capacidad de cómputo. Son múltiples las empresas que compiten por construir modelos que sean capaces de simular con mayor precisión la escritura humana, contribuyendo a su vez a la democratización del PLN haciendo públicos estos modelos.

No obstante, en la mayoría de los casos prácticos, no será suficiente utilizar estos modelos pre-entrenados de forma directa, sino que será necesario adaptarlos al ámbito lingüístico o a la tarea que queramos abordar.

En esta charla, te explicaremos los conceptos básicos subyacentes a estos modelos, además de cómo utilizar estos modelos preentrenados como base para adaptarlos a tu caso de uso. Como ejemplo, te mostraremos nuestro generador automático de recetas presentado dentro del hackathon organizado por SomosNLP.

Lugar: https://youtu.be/6VJF1u-3Dq4

Fecha y hora: 23 de junio a las 19.00h CET

Julián Cendrero Almodóvar

Data Scientist en mrHouston Tech Solutions con 4 años de experiencia en proyectos de I+D de inteligencia artificial. Es graduado en Física por la Universidad Complutense de Madrid y máster en Matemáticas Aplicadas por la Universidad de Cambridge. Actualmente, compagina su trabajo con la realización de un doctorado en Sistemas Inteligentes por la Universidad Nacional de Educación a Distancia. Ha trabajado en proyectos de medición del riesgo reputacional, análisis de redes sociales, sistemas de high-frequency trading basados en texto y modelado de tópicos con contexto temporal.

Silvia Duque Moro

Graduada en Ingeniería Informática y Estadística por la Universidad de Valladolid, y máster en Consultoría de Negocio por la Universidad Pontificia de Comillas. Actualmente trabaja como Research Scientist en el departamento de Innovación de NielsenIQ, investigando, desarrollando y aplicando algoritmos de Machine Learning y Deep Learning para facilitar los estudios de mercado realizados por la compañía haciendo uso de grandes cantidades de datos. Anteriormente ha trabajado como Data Scientist durante varios años, especializándose en el procesamiento del lenguaje natural.

NLP Spain

Buscar este blog

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave