Background

open-source

RAG - Un Chatbot IA pour discuter avec un chaîne youtube

Défiler vers le bas pour en savoir plus

Ce projet fait partie d’une série d’expérimentations personnelles pour l’intégration de l’IA dans ma pratique du développement. L’objectif est de créer un chatbot capable de discuter avec une chaîne YouTube via l’architecture RAG (Retrieval Augmented Generation). Un RAG est une architecture qui permet d’enrichir le contexte d’un LLM pour obtenir des réponses plus précises.

Préparation du jeu de données :

Récupération de la liste des vidéos d’une chaîne YouTube (métadonnées + transcription) Découpage de chaque transcription en morceaux (chunks) Génération d’embeddings (vecteurs) pour chaque morceau et stockage dans Elasticsearch L’utilisateur pose une question :

Transformation de la question en embeddings Comparaison pour trouver les vecteurs les plus proches dans la base Elasticsearch Construction du contexte Envoi de la question de l’utilisateur et du contexte à un LLM

Réponse avec liens vers les 3 vidéos les plus pertinentes (le moment le plus pertinent de la vidéo est sélectionné)

Tester le chatbot