PLN centrado en tus datos con Rubrix

El lunes 15 de noviembre a las 18.00h Daniel Vila Suero nos presentará Rubrix, una herramienta libre y gratuita para crear, gestionar y cuidar tus datos de entrenamiento de una manera eficaz involucrando distintos perfiles en el desarrollo de modelos PLN: científicos de datos, lingüistas, expertos de dominio e ingenieros.

Rubrix, herramienta Python desarrollada por Recognai, es el resultado de casi 5 años desarrollando soluciones de PLN para empresas, contribuyendo a librerías de código abierto como spaCy o AllenNLP y publicando modelos pre-entrenados en Hugging Face como el reciente Selectra.

Pero ¿qué es Rubrix? ¿qué lo hace diferente? y, sobre todo, ¿para qué lo necesitas? Todas estas preguntas (y cualquier otra que se os ocurra), las intentaremos resolver a través de ejemplos prácticos, con modelos y datos en español. En cualquier caso, si antes de apuntarte quieres saber un poco más, sigue leyendo.

Con modelos del lenguaje cada vez más potentes y accesibles es más fácil que nunca construir tus propias soluciones de PLN. Plataformas y herramientas, como el Hub de Hugging Face o Weights & Biases, permiten entrenar y experimentar con los últimos modelos del estado del arte. Sin embargo, hay una cuestión fundamental que sigue abierta: ¿cómo construir, evaluar y mantener los datos para entrenar y mejorar estos modelos para tu propio dominio? La realidad es que para evolucionar una solución PLN más tarde o más temprano necesitas ajustar tus modelos al problema concreto que quieres resolver (y no dejar de hacerlo a lo largo del tiempo). Además, esta cuestión se hace todavía más relevante cuando no haces PLN en inglés, debido a la escasez de conjuntos de datos y modelos pre-entrenados. Por todo esto y porque lo dice Andrew Ng, apúntate a la charla y aprende cómo construir modelos PLN en español de una manera eficaz, sostenible y puede que hasta divertida.

Meetup: https://www.meetup.com/es-ES/nlp-spain/events/281975539/

Daniel Vila Suero

Es cofundador de Recognai, empresa española especializada en procesamiento del lenguaje natural para empresas con clientes en España y Europa. En 2017, Daniel dejó la Universidad Politécnica de Madrid, donde trabajaba como investigador en tecnologías del lenguaje e Inteligencia Artificial, para lanzar Recognai. En la UPM, su trabajo en proyectos como la publicación del grafo de conocimiento de la Biblioteca Nacional de España fue clave para entender la importancia de involucrar distintos perfiles en la creación y mantenimiento de datos, idea fundamental detrás de Rubrix, la herramienta abierta desarrollada por Recognai. Además, Daniel y su equipo han contribuido y contribuyen a distintos proyectos de código abierto, como por ejemplo los primeros modelos en español para spaCy (allá por 2017) o el más reciente modelo del lenguaje Selectra (Spanish Electra) en Hugging Face.

NLP Spain

Buscar este blog

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave

PLN centrado en tus datos con Rubrix

Daniel Vila Suero

Etiquetas

Comentarios

Publicar un comentario

Entradas populares de este blog

MarIA: El primer modelo de IA masivo de la lengua española

Avanzando en la detección del lenguaje ofensivo en español

NLP en español es PLN: Recopilación de artículos introductorios y cursos de PLN en español