Ir al contenido principal

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave

Introducción El procesamiento del lenguaje natural es una rama de la informática que se centra en la comprensión y el procesamiento del lenguaje humano por parte de las máquinas. A través del uso de técnicas y algoritmos especializados, el procesamiento del lenguaje natural nos permite interactuar con las máquinas a través del lenguaje natural, como lo hacemos con otras personas. El procesamiento del lenguaje natural tiene una amplia gama de aplicaciones, desde el análisis de sentimiento en redes sociales hasta la traducción automática y el procesamiento de consultas de búsqueda. Esta tecnología ha revolucionado la forma en que nos comunicamos y accedemos a la información, y su importancia solo ha ido en aumento con el tiempo. A lo largo de los años, el procesamiento del lenguaje natural ha evolucionado gracias a avances en técnicas y algoritmos. En este artículo, exploraremos las técnicas y algoritmos clave que se utilizan en el procesamiento del lenguaje natural y cómo juegan un pape...

Recomendación del mes de agosto: Natural Language Processing with Python and spaCy



Este mes de agosto no podía faltar nuestra recomendación literaria. Hemos elegido el siguiente libro sobre Procesamiento del Lenguaje Natural:

"Natural Language Processing with Python and Spacy"

 

Es un libro muy ameno sobre Spacy y fácil de leer junto a un ordenador para entender las explicaciones mientras se ejecuta el código que proveen. Aunque el libro se escribió para la versión 2 de Spacy es perfectamente aplicable a la 3 a excepción de la parte de entrenado de modelos.

Así que si lo que quieres es usar la herramienta y entender cómo funciona Spacy este libro es perfecto para ti. Aprenderás los entresijos de la librería y cómo usar las características lingüísticas para extraer palabras clave, reconocer intenciones e incluso construir un pequeño chatbot con todo lo aprendido en el libro.

Os dejamos la tabla de contenidos para que os hagáis un idea mejor:


INTRODUCTION
  • Using Python for Natural Language Processing
  • The spaCy Library
  • Who Should Read This Book?
  • What’s in the Book?
1 HOW NATURAL LANGUAGE PROCESSING WORKS
  • How Can Computers Understand Language?
  • What Is a Statistical Model in NLP?
  • What Is Still on You
  • Summary
2 THE TEXT-PROCESSING PIPELINE
  • Setting Up Your Working Environment
  • Installing Statistical Models for spaCy
  • Basic NLP Operations with spaCy
  • Summary
3 WORKING WITH CONTAINER OBJECTS AND CUSTOMIZING SPACY
  • spaCy’s Container Objects
  • Customizing the Text-Processing Pipeline
  • Using spaCy’s C-Level Data Structures
  • Summary
4 EXTRACTING AND USING LINGUISTIC FEATURES
  • Extracting and Generating Text with Part-of-Speech Tags
  • Using Syntactic Dependency Labels in Text Processing
  • Summary
5 WORKING WITH WORD VECTORS
  • Understanding Word Vectors
  • Installing Word Vectors
  • Comparing spaCy Objects
  • Summary
6 FINDING PATTERNS AND WALKING DEPENDENCY TREES
  • Word Sequence Patterns
  • Extracting Keywords from Syntactic Dependency Trees
  • Using Context to Improve the Ticket-Booking Chatbot
  • Making a Smarter Chatbot by Finding Proper Modifiers
  • Summary
7 VISUALIZATIONS
  • Getting Started with spaCy’s Built-In Visualizers
  • Visualizing from Within spaCy
  • Customizing Your Visualizations with the Options Argument
  • Exporting a Visualization to a File
  • Using displaCy to Manually Render Data
  • Summary
8 INTENT RECOGNITION
  • Extracting the Transitive Verb and Direct Object for Intent Recognition
  • Finding the Meanings of Words Using Synonyms and Semantic Similarity
  • Extracting Intent from a Sequence of Sentences
  • Summary
9 STORING USER INPUT IN A DATABASE
  • Converting Unstructured Data into Structured Data
  • Building a Database-Powered Chatbot
  • Summary
10 TRAINING MODELS
  • Training a Model’s Pipeline Component
  • Training the Entity Recognizer
  • Creating a New Dependency Parser
  • Summary
11 DEPLOYING YOUR OWN CHATBOT
  • How Implementing and Deploying a Chatbot Works
  • Using Telegram as a Platform for Your Bot
  • Summary
12 IMPLEMENTING WEB DATA AND PROCESSING IMAGES
  • How It Works
  • Making Your Bot Find Answers to Questions from Wikipedia
  • Reacting to Images Sent in a Chat
  • Putting All the Pieces Together in a Telegram Bot
  • Summary
LINGUISTIC PRIMER
  • Dependency Grammars vs. Phrase Structure Grammars
  • Common Grammar Concepts
Nos encanta saber vuestras opiniones así que si te animas a leerlo o ya lo has leído ¡déjanos tus comentarios!

Comentarios

Entradas populares de este blog

MarIA: El primer modelo de IA masivo de la lengua española

Estos días atrás se ha hablado mucho sobre MarIA, el nuevo modelo de lenguaje en español del Barcelona Supercomputing Center : Nos gustaría recoger en este artículo, extraído de un post escrito por Carmen Torrijos en LinkedIn, algunos datos rápidos: Corpus inicial: 59TB de texto web de los archivos de la Biblioteca Nacional de España. Tiempo de procesamiento para limpiar el corpus: 6.910.000 horas. Corpus limpio sin duplicidades: 201.080.084 documentos limpios (570 GB). Número de tokens: 135.733.450.668 (dato muy NLP). Tiempo de procesamiento para entrenar el modelo: 184.000 horas de procesador y 18.000 horas de CPU. Número de parámetros de los modelos liberados: 125.000.000 y 355.000.000. Y 5 conclusiones: El corpus de texto supera en órdenes de magnitud el tamaño de los existentes hasta el momento en español. Un proyecto así es inaccesible a nivel de empresa o grupo de investigación, debido no ya al acceso al corpus sino a la capacidad de computación necesaria. Es un modelo generali...

Comprendiendo el lenguaje humano a través del procesamiento del lenguaje natural: técnicas y algoritmos clave

Introducción El procesamiento del lenguaje natural es una rama de la informática que se centra en la comprensión y el procesamiento del lenguaje humano por parte de las máquinas. A través del uso de técnicas y algoritmos especializados, el procesamiento del lenguaje natural nos permite interactuar con las máquinas a través del lenguaje natural, como lo hacemos con otras personas. El procesamiento del lenguaje natural tiene una amplia gama de aplicaciones, desde el análisis de sentimiento en redes sociales hasta la traducción automática y el procesamiento de consultas de búsqueda. Esta tecnología ha revolucionado la forma en que nos comunicamos y accedemos a la información, y su importancia solo ha ido en aumento con el tiempo. A lo largo de los años, el procesamiento del lenguaje natural ha evolucionado gracias a avances en técnicas y algoritmos. En este artículo, exploraremos las técnicas y algoritmos clave que se utilizan en el procesamiento del lenguaje natural y cómo juegan un pape...

Cómo ajustar tu propio modelo de lenguaje generativo

¿Has oído hablar de GPT2, GPT3 u OPT? Estos son algunos de los modelos generativos de lenguaje más conocidos y utilizados a día de hoy, con aplicaciones en múltiples ámbitos como chatbots, question answering o autocompleción, entre otros. La generación del lenguaje natural es uno de los subcampos del PLN que más ha evolucionado en los últimos años gracias a los grandes volúmenes de datos disponibles y al aumento en la capacidad de cómputo. Son múltiples las empresas que compiten por construir modelos que sean capaces de simular con mayor precisión la escritura humana, contribuyendo a su vez a la democratización del PLN haciendo públicos estos modelos. No obstante, en la mayoría de los casos prácticos, no será suficiente utilizar estos modelos pre-entrenados de forma directa, sino que será necesario adaptarlos al ámbito lingüístico o a la tarea que queramos abordar. En esta charla, te explicaremos los conceptos básicos subyacentes a estos modelos, además de cómo utilizar estos modelos ...