Ir al contenido principal

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave

Introducción El procesamiento del lenguaje natural es una rama de la informática que se centra en la comprensión y el procesamiento del lenguaje humano por parte de las máquinas. A través del uso de técnicas y algoritmos especializados, el procesamiento del lenguaje natural nos permite interactuar con las máquinas a través del lenguaje natural, como lo hacemos con otras personas. El procesamiento del lenguaje natural tiene una amplia gama de aplicaciones, desde el análisis de sentimiento en redes sociales hasta la traducción automática y el procesamiento de consultas de búsqueda. Esta tecnología ha revolucionado la forma en que nos comunicamos y accedemos a la información, y su importancia solo ha ido en aumento con el tiempo. A lo largo de los años, el procesamiento del lenguaje natural ha evolucionado gracias a avances en técnicas y algoritmos. En este artículo, exploraremos las técnicas y algoritmos clave que se utilizan en el procesamiento del lenguaje natural y cómo juegan un pape

¡Hola Mundo! Presentamos NLP Spain

Nace NLP Spain

Cuando estás investigando y aprendiendo sobre procesamiento del lenguaje natural.

La gran mayoría de recursos que encuentras son para el inglés.

Y es para este idioma con el que poco a poco vas adquiriendo nuevo conocimiento.


Pero... ¿Qué pasa cuando quieres aplicar esos conocimientos para un proyecto en español?

¡Efectivamente!, hay poco o nada con lo que trabajar.


¡Hola!, somos NLP Spain, y venimos a cambiar esto.

El español es uno de los lenguajes más hablados del mundo, y sin embargo no tiene esta representación necesaria.

Nos preguntamos porqué podría ser esto, y una de las respuestas fue la falta de comunidades.

Hay poco contenido en español porque hay pocas comunidades que generen ese contenido, uno puede generar contenido por su cuenta, pero como una comunidad no hay nada para esta tarea.

Es por esto que decidimos crear una comunidad para que todos puedan aprender y aportar recursos sobre NLP.

En el momento de escribir  estas lineas, ya tenemos cerrado el primer evento y ponente para el segundo. Personas con muchas ganas de colaborar y divulgar.

Además hemos comenzado el proceso para generar un Corpus en Español como primer paso hacia el objetivo de convertir el procesamiento de lenguaje natural en español en una alternativa más que poderosa y disponible para todos.

¡Únete a nosotros!

Nos vemos pronto.


Atentamente:

Jorge y Josheriff,

fundadores de NLP Spain.



Comentarios

  1. Hola, enhorabuena por la iniciativa. Os he conocido por meetup.com

    He trabajado académicamente LDA con gensim en 2017 (6 meses). No he estado nunca en este campo profesional (por desgracia) por lo que mi actividad es lúdica y voluntaria. A día de hoy es para una fundación española =)

    Desde hace unos meses empecé un trabajo centrado en construir modelos que permitan establecer qué grado de correspondencia tiene un documento con un tópico.

    A día de hoy, estoy investigando métodos para localizar tópicos que tengan sentido. Utilizo LDA de scikit-learn. Mi línea de trabajo actual es realizar un barrido de los hiperparámetros de LDA + preprocesado fino para revelar tópicos con sentido en unas materias determinadas. Para ello he leido algunos papers y haciendo pruebas.

    Si alguien tiene experiencia o puede estar interesado en conocer mi experiencia en este campo puede contactarme. Por mi parte, también estoy buscando personas que hayan trabajado o leido papers, manejen detalles de alto nivel, etc que me permitan establecer y comparar posibles soluciones antes de ponerme a desarrollar líneas de código.


    Saludos,

    D.

    ResponderEliminar
    Respuestas
    1. Hola David!

      Muchas gracias y nos alegra saber que te agrada la iniciativa. Tenemos un grupo en LinkedIn donde puedes poner tus inquietudes y/o preguntar. Es un buen sitio para realizar discusiones. ¡Te animo a que te apuntes!

      https://www.linkedin.com/groups/12551439/

      Un saludo!

      Eliminar

Publicar un comentario

Entradas populares de este blog

MarIA: El primer modelo de IA masivo de la lengua española

Estos días atrás se ha hablado mucho sobre MarIA, el nuevo modelo de lenguaje en español del Barcelona Supercomputing Center : Nos gustaría recoger en este artículo, extraído de un post escrito por Carmen Torrijos en LinkedIn, algunos datos rápidos: Corpus inicial: 59TB de texto web de los archivos de la Biblioteca Nacional de España. Tiempo de procesamiento para limpiar el corpus: 6.910.000 horas. Corpus limpio sin duplicidades: 201.080.084 documentos limpios (570 GB). Número de tokens: 135.733.450.668 (dato muy NLP). Tiempo de procesamiento para entrenar el modelo: 184.000 horas de procesador y 18.000 horas de CPU. Número de parámetros de los modelos liberados: 125.000.000 y 355.000.000. Y 5 conclusiones: El corpus de texto supera en órdenes de magnitud el tamaño de los existentes hasta el momento en español. Un proyecto así es inaccesible a nivel de empresa o grupo de investigación, debido no ya al acceso al corpus sino a la capacidad de computación necesaria. Es un modelo generali

NLP en español es PLN: Recopilación de artículos introductorios y cursos de PLN en español

El Procesamiento del Lenguaje Natural, o PLN para simplificar, es una rama de la inteligencia artificial y la lingüística aplicada. A nuestro parecer un área muy interesante que conjuga humanidades con la tecnología más puntera. Para que luego digan que hay que elegir entre ciencias o humanidades. Un O exclusivo que nos han inculcado y que no puede estar tan equivocado. En este artículo recopilatorio queríamos poner nuestro granito de arena para ayudar a todos aquellos interesados en el PLN (o NLP si se prefiere aunque La Fundéu no estaría muy contenta ) pero que no están tan familiarizados con las herramientas técnicas que permiten procesar el lenguaje o cómo darle utilidad a los conocimientos tan valiosos sobre lingüística de una manera práctica. La principal diferencia de este artículo con otros es que vamos a intentar que los recursos presentados sirvan o pongan de ejemplo el procesamiento del español, segunda lengua materna más hablada en el mundo después del chino pero que tiene

Cómo ajustar tu propio modelo de lenguaje generativo

¿Has oído hablar de GPT2, GPT3 u OPT? Estos son algunos de los modelos generativos de lenguaje más conocidos y utilizados a día de hoy, con aplicaciones en múltiples ámbitos como chatbots, question answering o autocompleción, entre otros. La generación del lenguaje natural es uno de los subcampos del PLN que más ha evolucionado en los últimos años gracias a los grandes volúmenes de datos disponibles y al aumento en la capacidad de cómputo. Son múltiples las empresas que compiten por construir modelos que sean capaces de simular con mayor precisión la escritura humana, contribuyendo a su vez a la democratización del PLN haciendo públicos estos modelos. No obstante, en la mayoría de los casos prácticos, no será suficiente utilizar estos modelos pre-entrenados de forma directa, sino que será necesario adaptarlos al ámbito lingüístico o a la tarea que queramos abordar. En esta charla, te explicaremos los conceptos básicos subyacentes a estos modelos, además de cómo utilizar estos modelos