Génération par IA d'articles sportifs multi-lingues

Le contexte

OneFootball est la plus grande application de football au monde, avec 45 millions de lecteurs actifs par mois. Pour alimenter ses communautés de fans à travers le globe, la plateforme doit publier un flux constant d'actualités couvrant des centaines de clubs, dans des dizaines de langues — un volume éditorial qu'aucune rédaction traditionnelle ne peut absorber à coût raisonnable.

Notre équipe a été mandatée pour développer un système multi-agent autonome capable de produire et publier des articles d'actualité sportive directement sur OneFootball, en continu, sans intervention humaine. L'enjeu : couvrir l'actualité de dizaines de clubs professionnels dans la langue natale de chaque communauté de fans, avec un niveau de qualité éditorial suffisant pour activer l'engagement sur la plateforme.

Les défis

01

Couverture massive et multilingue

Produire des articles pour le monde entier, chacun dans la langue de sa communauté (allemand, portugais brésilien, espagnol, italien, français...), avec un ton et des références culturelles adaptés.

02

Coût unitaire minimal

Le modèle économique impose un coût par article drastiquement inférieur à celui d'un rédacteur humain, tout en maintenant une qualité suffisante pour une plateforme de référence mondiale.

03

Réactivité en temps réel

Le système doit réagir à des événements hétérogènes — un but marqué, une rumeur de transfert, un communiqué officiel — et décider en autonomie quel type de contenu produire, à quel moment, et avec quel niveau de profondeur.

04

Qualité sans supervision

Sans rédacteur en chef dans la boucle, le système doit intégrer ses propres mécanismes de contrôle qualité et d'amélioration continue, formant une boucle de feedback fermée.

05

Activation communautaire

Au-delà de la simple publication, l'objectif est de transformer des audiences passives en communautés actives — susciter la réaction, le partage et la discussion au sein de l'application.

La stack technique

Orchestration	Celery + Redis (chaînes de tâches distribuées)
Agents LLM	OpenAI · Anthropic Claude · Google Gemini
Sources de données	Serper API · RSS · Google News
Distribution	API OneFootball
Infrastructure	Azure · Docker · Auto-scaling

La solution

Ingestion et stockage multi-modal

Le système ingère en continu des flux de données hétérogènes — données sportives en temps réel (scores, événements de match, compositions), fils de réseaux sociaux et flux d'actualités (RSS, Google News, sites officiels). Ces données alimentent un pipeline d'ingestion qui les distribue vers les agents de production.

Scraping optimisé pour LLMs

Les sources web sont scrapées via un pipeline de nettoyage conçu pour minimiser les tokens inutiles envoyés aux modèles de langage. Le contenu brut — HTML, menus de navigation, publicités, footers — est filtré et restructuré en un format compact avant d'être transmis aux agents. Cette étape de pré-traitement réduit drastiquement les coûts d'inférence et améliore la qualité des outputs en éliminant le bruit contextuel qui dégrade l'attention des modèles.

Système de triggers

Trois types de triggers orchestrent la production de contenu. Les triggers événementiels réagissent en temps réel aux événements de match et aux signaux des réseaux sociaux. Les triggers planifiés déclenchent la production d'analyses d'avant-match, de résumés post-match et de rapports quotidiens selon un calendrier éditorial automatisé. Les triggers manuels permettent à un administrateur de lancer une production à la demande via une interface dédiée.

Routage éditorial

Lorsqu'un trigger se déclenche, un routeur de contenu détermine le type d'article à produire : breaking news, analyse de match, mise à jour de transfert, communiqué de club ou article de fond. Ce routage conditionne l'ensemble du pipeline en aval — profondeur de la recherche contextuelle, ton rédactionnel, et allocation du modèle de langage.

Routeur LLM intelligent et allocation par tiers

Le cœur du système est un routeur intelligent qui optimise l'allocation des modèles de langage tâche par tâche, selon trois tiers de performance :

Tier Efficient

Contrôle qualité, validation de format, vérifications factuelles. Des modèles rapides et économiques pour les tâches de validation.

Tier Balanced

Analyse contextuelle, extraction de données, détection de tendances, analyse de sentiment, optimisation SEO et génération de métadonnées.

Tier Premium

Rédaction créative, création narrative, articles de fond et analyses complexes. Les modèles les plus capables pour les tâches exigeant nuance et style.

Cette stratégie de routage permet de maintenir un coût unitaire minimal tout en réservant la puissance de calcul aux étapes où elle a le plus d'impact sur la qualité finale.

Boucle de feedback et QA Gate automatisé

Chaque article produit passe par un portail de validation automatisé — un agent évaluateur qui analyse la conformité éditoriale, la cohérence factuelle et l'alignement avec les standards de la plateforme. Les articles approuvés sont transmis à la publication. Les articles rejetés sont renvoyés dans le pipeline avec un diagnostic explicite, permettant au système de corriger et régénérer le contenu. Cette boucle de feedback fermée garantit que seuls les articles conformes atteignent les lecteurs.

Publication sur OneFootball

Les articles validés sont publiés directement sur la plateforme OneFootball via son API, enrichis d'images sous licence Getty et de métadonnées optimisées pour le référencement interne.

Couche d'intelligence et amélioration continue

En aval de la publication, une couche d'intelligence trace l'exécution de chaque agent, mesure les métriques de performance et de coût, et alimente un moteur d'amélioration des modèles. Ce moteur analyse les performances hyperlocalisées (par club, par langue, par type de contenu), les tendances d'engagement et le sentiment des communautés. Ces insights sont réinjectés dans le routeur LLM, fermant la boucle d'apprentissage : le système ne se contente pas de produire — il apprend de sa propre production pour s'améliorer en continu.

Les résultats

$0.12

Par article de 300 mots

30+

Clubs couverts en 9 langues

< 15 min

De la détection à la publication

En produisant du contenu hyperlocal dans la langue natale de chaque communauté, le pipeline transforme des millions de lecteurs passifs en communautés engagées qui réagissent, partagent et débattent au sein de l'écosystème OneFootball.

Zéro doublon, zéro intervention — le système de locks distribués et de déduplication garantit une production propre, 24h/24. L'ajout d'un nouveau club se réduit à une entrée de configuration, sans aucune modification de code.