#001 - IA generativa con datos propios sin re-entrenar episode artwork

EPISODE · Sep 20, 2023 · 49 MIN

#001 - IA generativa con datos propios sin re-entrenar

from Alucinando con la IA generativa en AWS · host Amazon Web Services España

Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte del entrenamiento de un modelo, sin olvidarnos también de evitar las alucinaciones que pueden producirse.En este capítulo Pablo Nuñez Pölcher nos cuenta como el uso de estrategias como la generación amplificada por recuperación de información (Retrieval Augmented Generation o RAG) son claves para conseguir estos objetivos. Veremós en qué se basa esta estrategia, qué componentes tecnológicos son necesarios, las distintas alternativas para su implementación en AWS y como escojer la más adecuada: desde el servicio gestionado Amazon Kendra hasta los distintos modelos fundacionales para el cálculo de embeedings, pasando por las bases de datos vectoriales disponibles.Si quieres probar tu mismo los conceptos aparecidos en el capítulo, con distintos proveedores de modelos y distintos orígenes para RAG puedes hacerlo siguiendo este link: https://github.com/aws-samples/aws-genai-llm-chatbot/tree/mainAlbert Capdevila es un arquitecto de soluciones de AWS basado en Barcelona, ayudando a los clientes a construir sus cargas en AWS de acuerdo a las mejores prácticas. Después de más de 15 años trabajando en proyectos en el ámbito de las arquitecturas de integración, lleva ya 4 años focalizado en el cloud y en el AI/ML.Albert está actualmente trabajando en un modelo de predicción del tiempo libre que sus hijos le van a dejar para poder ir a escalar montañas.Contacta con Albert Capdevila en LinkedIn en https://www.linkedin.com/in/albertcapdevila/Pablo Núñez es arquitecto de soluciones de AWS con base en Madrid. Desde allí, trabaja con clientes de salud y educación ayudándoles diseñar y desplegar sus cargas de manera escalable, sostenible y según mejores prácticas.Lleva inmerso en el mundo del cloud y el machine learning más de 5 años, y otros 15 de desarrollador backend. Su pasión por la bioingeniería lo ha llevado a ser además biólogo con especialización en fisiología.Cuando no está frente al ordenador, reparte su tiempo entre la electrónica, sus bicicletas, su alérgico gato negro (Hawking), y discutiendo investigaciones médicas con su esposa.Contacta con Pablo Nuñec en LinkedIn en https://www.linkedin.com/in/ppolcher

Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte del entrenamiento de un modelo, sin olvidarnos también de evitar las alucinaciones que pueden producirse.En este capítulo Pablo Nuñez Pölcher nos cuenta como el uso de estrategias como la generación amplificada por recuperación de información (Retrieval Augmented Generation o RAG) son claves para conseguir estos objetivos. Veremós en qué se basa esta estrategia, qué componentes tecnológicos son necesarios, las distintas alternativas para su implementación en AWS y como escojer la más adecuada: desde el servicio gestionado Amazon Kendra hasta los distintos modelos fundacionales para el cálculo de embeedings, pasando por las bases de datos vectoriales disponibles.Si quieres probar tu mismo los conceptos aparecidos en el capítulo, con distintos proveedores de modelos y distintos orígenes para RAG puedes hacerlo siguiendo este link: https://github.com/aws-samples/aws-genai-llm-chatbot/tree/mainAlbert Capdevila es un arquitecto de soluciones de AWS basado en Barcelona, ayudando a los clientes a construir sus cargas en AWS de acuerdo a las mejores prácticas. Después de más de 15 años trabajando en proyectos en el ámbito de las arquitecturas de integración, lleva ya 4 años focalizado en el cloud y en el AI/ML.Albert está actualmente trabajando en un modelo de predicción del tiempo libre que sus hijos le van a dejar para poder ir a escalar montañas.Contacta con Albert Capdevila en LinkedIn en https://www.linkedin.com/in/albertcapdevila/Pablo Núñez es arquitecto de soluciones de AWS con base en Madrid. Desde allí, trabaja con clientes de salud y educación ayudándoles diseñar y desplegar sus cargas de manera escalable, sostenible y según mejores prácticas.Lleva inmerso en el mundo del cloud y el machine learning más de 5 años, y otros 15 de desarrollador backend. Su pasión por la bioingeniería lo ha llevado a ser además biólogo con especialización en fisiología.Cuando no está frente al ordenador, reparte su tiempo entre la electrónica, sus bicicletas, su alérgico gato negro (Hawking), y discutiendo investigaciones médicas con su esposa.Contacta con Pablo Nuñec en LinkedIn en https://www.linkedin.com/in/ppolcher

NOW PLAYING

#001 - IA generativa con datos propios sin re-entrenar

0:00 49:03

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

Frequently Asked Questions

How long is this episode of Alucinando con la IA generativa en AWS?

This episode is 49 minutes long.

When was this Alucinando con la IA generativa en AWS episode published?

This episode was published on September 20, 2023.

What is this episode about?

Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte...

Can I download this Alucinando con la IA generativa en AWS episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!