Ir al contenido principal

Entradas

Mostrando entradas de julio, 2021

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave

Introducción El procesamiento del lenguaje natural es una rama de la informática que se centra en la comprensión y el procesamiento del lenguaje humano por parte de las máquinas. A través del uso de técnicas y algoritmos especializados, el procesamiento del lenguaje natural nos permite interactuar con las máquinas a través del lenguaje natural, como lo hacemos con otras personas. El procesamiento del lenguaje natural tiene una amplia gama de aplicaciones, desde el análisis de sentimiento en redes sociales hasta la traducción automática y el procesamiento de consultas de búsqueda. Esta tecnología ha revolucionado la forma en que nos comunicamos y accedemos a la información, y su importancia solo ha ido en aumento con el tiempo. A lo largo de los años, el procesamiento del lenguaje natural ha evolucionado gracias a avances en técnicas y algoritmos. En este artículo, exploraremos las técnicas y algoritmos clave que se utilizan en el procesamiento del lenguaje natural y cómo juegan un pape

Creación de un mini corpus del español con libros de dominio público

Los libros de dominio público son un gran recurso para generar un pequeño corpus del español gracias a la variedad de los textos. En este artículo os explicamos cómo generarlo de una manera muy sencilla a partir de los documentos indexados en la web de  textos.info . En  textos.info  hay más de 4000 libros disponibles para leer y/o descargar. Desde clásicos como "La Ilíada", "La Biblia" o "El Quijote" a libros más "modernos" (comienzos del s.XX) como son "Poeta en Nueva York", "Niebla" o "La Metamorfosis". Requisitos Python 3.8 - Todos los ejemplos que usan python se han ejecutado con esta versión. PyEnv o Conda - Recomendamos el uso de alguna de estas herramientas para la gestión de versiones de Python y los entornos virtuales. Pandoc 2.14 - Herramienta que permite convertir entre varios formatos como puede ser de ePub a texto plano. Requisitos para los scripts de Python Para que los scripts de Python se ejecuten

Generación de un Corpus del Español para PLN usando la Wikipedia

Para poder aplicar las técnicas de Procesamiento de Lenguaje Natural necesitamos muchos textos representativos del idioma en el que se va a aplicar. En el caso de este artículo es el español . Esta gran cantidad de textos se denomina " Corpus " y cuanto más grande y variado sea mejor. Existen corpus ya creados en la red si lo que buscas es usar uno ya construido pero si lo que quieres es tener el control de la generación de tu propio corpus o simplemente quieres generar tu propio corpus en español, entonces este es tu artículo. Hemos elegido la Wikipedia como fuente de datos ya que proporciona una gran cantidad de entradas en español de muy diferentes temas. Para empezar a jugar está bien, pero para un corpus serio esto no es suficiente ya que no es representativo de las diferentes formas de usar el español. Sin embargo, como decimos, puede ser el punto de partida de algo mucho más grande. Así que pongámonos manos a la obra. Generación del Corpus La generación del corpus re

Recomendación del mes de Julio: The Conversational Interface

El libro que recomendamos en este mes de julio, antes de comenzar las vacaciones y para disfrutar de los merecidos descansos que todos nos hemos ganado, es esta fantástica obra de los autores Michael McTear, Zoraida Callejas y David Griol: "The Conversational Interface"   Se trata de una introducción completa a las interfaces conversacionales según la reseña del propio libro, pero mas bien diría que es un paseo detallado por cada uno de los aspectos y componentes que forman un sistema conversacional. El libro se compone de cuatro partes: Parte 1: Introduce al lector en los antecedentes de los interfaces conversacionales repasando el recorrido histórico que nos ha traído hasta el punto en el que estamos, e introduciendo conceptos que luego se desarrollan en el resto del libro. Parte 2: Explica las diferentes tecnologías que forman una interfaz conversacional: ASR, NLU, Dialog Manager, NLG, TTS, etc con capítulos prácticos y ejercicios. Parte 3: Analiza varios aspectos como la