Yahoo Sports — Fantasy Basketball AI Assistant

Le contexte

Fort du succès de notre chatbot sportif propriétaire — capable de répondre en temps réel à des questions sportives complexes en gardant la précision factuelle — nous avons été sollicités par Yahoo Sports pour développer un Proof of Concept autour d'un de leur produit phare : Yahoo Fantasy Basketball.

L'enjeu : concevoir un assistant IA conversationnel capable d'accompagner les managers de ligues fantasy dans leurs décisions stratégiques — draft, trades, gestion de roster — en s'appuyant sur une compréhension profonde des données NBA, actualisées en temps réel.

Le POC devait démontrer qu'une architecture RAG (Retrieval-Augmented Generation) pouvait combiner deux temporalités de données critiques : les données temps réel (stats de joueurs, blessures, transactions de roster, scores en cours, actualités sportives via Yahoo Sports API, Google News) et les données long-terme (historiques de performances, tendances saisonnières, profils de joueurs enrichis, stockés et indexés dans une base vectorielle Qdrant pour permettre une recherche sémantique et un raisonnement contextuel sur la durée).

Les défis

01

Orchestration multi-sources en temps réel

Agréger et normaliser des flux hétérogènes (Yahoo Sports, scraping d'actualités) dans un pipeline unifié.

02

Architecture RAG hybride

Concevoir un système capable de distinguer quand puiser dans le contexte temps réel (tool calling dynamique) et quand s'appuyer sur la base de connaissances vectorielle pour des analyses historiques et tendancielles — le tout de manière transparente pour l'utilisateur.

03

Fiabilité des réponses dans un domaine factuel

En fantasy sports, une stat erronée ou une blessure manquée impacte directement le rendement des managers. Nous avons implémenté un pipeline de fact-checking automatisé (extraction de faits, vérification croisée contre les sources) et un système de nettoyage des données LLM-ready.

04

Expérience conversationnelle temps réel

Streaming des réponses, gestion d'historique conversationnel, génération de follow-up questions — le tout avec une latence perçue minimale malgré la complexité du pipeline sous-jacent.

La stack technique

Web App	NextJS · Python FastAPI
Données temps réel	Yahoo Sports · Google News · Serper API
RAG & Recherche	Qdrant (base vectorielle — stockage sémantique long-terme)
Persistence	MongoDB — données utilisateurs
Infra	Azure Container Apps · Docker · Terraform

La solution

Nettoyage des données LLM-ready

Les données sportives brutes sont volumineuses et hétérogènes — formats incohérents, champs redondants, bruit structurel. Une couche de prétraitement dédiée normalise, filtre et restructure ces données avant injection dans le contexte du modèle. Le résultat : des tokens utiles, des coûts d'inférence réduits, et des réponses plus fiables.

RAG hybride : temps réel + mémoire long-terme

Le système combine deux modes de récupération d'information. Le tool calling dynamique interroge les APIs en temps réel pour les données fraîches (scores en cours, dernières transactions, blessures). La base vectorielle Qdrant stocke les profils de joueurs enrichis, les historiques de performances et les tendances saisonnières pour un raisonnement contextuel sur la durée. Le modèle choisit automatiquement la source appropriée selon la nature de la question.

Pipeline de fact-checking automatisé

Chaque réponse générée passe par une étape d'extraction de faits et de vérification croisée contre les sources de données. Les données brutes sont nettoyées et restructurées en amont pour éliminer le bruit avant injection dans le contexte du modèle — réduisant les hallucinations et les erreurs factuelles dans un domaine où la précision est critique.

Streaming conversationnel

Les réponses sont streamées en temps réel vers l'utilisateur pendant que le pipeline continue de travailler en arrière-plan. L'historique conversationnel est maintenu pour permettre des échanges multi-tours naturels, avec génération automatique de follow-up questions pour guider les managers dans leur analyse.

Conclusion

Ce POC a démontré la viabilité d'un assistant IA fantasy sports production-ready, capable de rivaliser avec l'expertise d'un analyste NBA tout en offrant une réactivité temps réel et une profondeur d'analyse historique grâce à l'architecture RAG — le tout dans une expérience conversationnelle fluide et multilingue.