Etiqueta: Libro

Este es un libro interesante para aquellas personas que con conocimientos de aprendizaje automático de nivel intermedio que quieran especializarse en los grandes modelos de lenguaje y sus aplicaciones. Prácticamente es la continuación de otro libro de O´Reilly Media Hands On Machine Learning... ya que empieza donde termina el otro con la introducción a los Transformers, por lo tanto es buena opción para aquellos que lo usaron como libro de texto para aprender estas materias.

La peculiaridad del libro y que más llama la atención cuando se ojea es lo profusamente ilustrado que está aunque peca más de cantidad que de calidad ya que an algunos casos los dibujos no son lo suficientemente expresivos, aunque se agradece, dado lo árido de la materia el esfuerzo de los autores en hacerlas.

No es un libro para aprender a escribir prompts para la IA generativa exclusivamente, tiene un apartado para el tema pero no se extiende en él dejando espacio para introducir otras aplicaciones no tan conocidas pero de incuestionable utlidad a profesionales y organizaciones.

Contenido

El libro consta de tres secciones, una primera introductoria y las dos siguientes sobre cómo se aplica la tecnología:

Entendiendo los Modelos de Lenguaje

Empezando en el primer capítulo con una introducción más que recomendable donde se relata la evolución de estas tecnologías así como una somera descripción de sus aplicaciones pasa en los siguientes a adentrarnos en los fundamentos tecnológicos de los modelos de lenguaje, la tokenización, es decir la transformación de los textos en números que puedan ser procesados por los algoritmos matemáticos y termina con una exhaustiva descripción de los transformers, la máquina matemática sobre la que se fundamenta esta revolución.

Usando Modelos de Lenguaje Preentrenados

En esta sección se tratan los casos de uso que no requieren de conocimientos de aprendizaje profundo para poder ser aplicados, pudiendo utilizarse tanto modelos locales como en la nube. La sección contiene temas de interés como clasificación de textos, técnicas conversacionales de interacción con los modelos (prompt engineering), búsqueda semántica e indexado de documentos y uso de modelos multimodales para el proceso y generación de otro tipo de información que no sea textual como pueden ser imágenes y sonidos.

Ajuste Fino los Modelos de Lenguaje

Esta materia ya es más compleja ya que no solo hay que comprender como funciona un LLM por dentro si no que además hay que aprender a hackearlo matemáticamente para poder contextualizar la generación de texto a nuestro área de interés.

Conclusiones

El libro trata de una materia que está evolucionando a gran velocidad y se nota ya el desfase a un año de su publicación, de todas formas el contenido sigue siendo interesante y es un buen libro de texto para quien quiera adentrarse en estas materias con algo de bagaje prévio en el mundo del aprendizaje automático.

Nota: Si no quiere profundizar mucho en cuestiones técnicas quizás le resulte más interesante AI Engineering de Chip Huyen que estoy leyendo ahora y es más descriptivo que éste.

Reseña de Hands-On Large Language Models

Contenido

Entendiendo los Modelos de Lenguaje

Usando Modelos de Lenguaje Preentrenados

Ajuste Fino los Modelos de Lenguaje

Conclusiones