Pourquoi l’IA échoue dans la livraison logicielle agile : exemples et solutions pour les Engineering Managers

De nombreux CTOs placent beaucoup d’espoir dans l’utilisation de l’IA dans la livraison logicielle agile : plus de vitesse, plus d’automatisation, plus de rendement. Cela est souvent vrai à court terme. Et pourtant, beaucoup d’équipes et de CTOs échouent à démontrer comment cette accélération locale se traduit en bénéfice pour le client et en valeur ajoutée pour l’entreprise.

Le problème, c’est que les entreprises, dans l’enthousiasme pour l’IA, optimisent les mauvaises choses : plus de tokens au lieu de plus de valeur pour le client, plus de code au lieu de plus de confiance, plus d’agents au lieu de meilleurs systèmes de livraison.

Cet article s’inscrit volontairement dans la continuité de nos deux autres articles :

Ici, il s’agit du pont entre les deux : pourquoi l’IA échoue-t-elle dans la livraison logicielle agile dans la pratique ? Les exemples montreront concrètement ce que les managers peuvent faire et quelles solutions tiennent réellement la route.

TL;DR

L’IA dans la livraison logicielle agile échoue le plus souvent non pas par manque d’utilisation des outils, mais à cause de logiques de pilotage erronées.
Le “tokenmaxxing” en est le symptôme le plus visible : les équipes optimisent la consommation d’IA plutôt que le flow, la qualité et la valeur client.
Les principaux contre-mesures sont une responsabilité claire, un Engineering Harness robuste, des boucles rapides de feedback client et un apprentissage organisationnel.

Pourquoi l’IA optimise si souvent le mauvais objectif dans la livraison logicielle agile

Dès que l’IA est introduite comme levier de productivité, quelque chose de très prévisible se produit dans de nombreuses entreprises : ce qui est mesurable devient l’objectif. Cela se reflète dans la nouvelle tendance Tokenmaxxing. Pragmatic Engineer sur la tendance du tokenmaxxing

Par là, on entend que les entreprises ou les équipes considèrent implicitement ou explicitement une consommation élevée de tokens comme un signe de bonne utilisation de l’IA. C’est dangereux, tant sur le plan économique que sur le plan organisationnel. Car les tokens sont au mieux une mesure d’entrée, mais pas une mesure de valeur.

Le schéma est ancien. Autrefois, les “Lines of Code” étaient surévaluées comme métrique ; aujourd’hui, c’est la consommation de tokens ou les tableaux de bord d’utilisation de l’IA. Dans les deux cas, une variante de la loi de Goodhart s’applique : dès qu’une métrique devient un objectif, elle perd sa valeur en tant que métrique. Martin Fowler sur les Lines of Code comme problème de métrique, Wikipedia sur la loi de Goodhart

Pour l’IA dans la livraison logicielle agile, cela signifie ceci : qui maximise l’activité à court terme obtient souvent davantage d’activité IA. Mais pas automatiquement une meilleure livraison logicielle agile.

L’état de la recherche à ce sujet est décevant : au niveau individuel, on observe déjà des effets de productivité nets ; au niveau de l’équipe et de l’organisation, en revanche, beaucoup moins d’améliorations réellement solides. Nous avons résumé les détails ici : Sur l’état des études en 2026 sur l’IA dans le développement logiciel agile

Quatre exemples typiques de la manière dont l’IA échoue dans la livraison logicielle agile

Comment l’IA échoue dans la livraison logicielle agile | Exemple 1

1. Plus de code, mais moins de compréhension

Le premier échec est banal : les équipes produisent nettement plus de modifications, mais comprennent vraiment une part décroissante de celles-ci.

Pour les managers, cela paraît souvent positif au début :

plus de pull requests
des premières implémentations plus rapides
plus d’histoires “terminées”

La contrepartie apparaît plus tard :

les revues deviennent plus superficielles
l’ownership se dilue
l’analyse des incidents prend plus de temps
les refactorings sont évités parce que plus personne n’est sûr de ce qui pourrait casser et où

Kent Beck décrit dans son article “Trust Factory” que des pratiques comme les tests, les revues, le refactoring et la livraison incrémentale construisent avant tout la confiance. C’est précisément cette confiance qui disparaît lorsque l’IA produit plus vite que l’équipe ne peut comprendre, vérifier et assumer la responsabilité de ce qu’elle produit. Kent Beck dans Trust Factory sur la confiance en ingénierie

Addy Osmani décrit un risque similaire sous le nom de Comprehension Debt : lorsque les équipes livrent toujours plus de code qu’elles ne parviennent plus à comprendre activement, la distance entre le système et la compréhension s’accroît à chaque changement. Addy Osmani sur la Comprehension Debt

Exemple documenté

Dans un reportage de WIRED de l’été 2025, le magazine décrit comment Notion travaille en interne avec le codage assisté par IA. Ce qui est particulièrement révélateur, ce n’est pas seulement la vitesse, mais aussi la transformation du mode de travail : un cofondateur de Notion décrit l’utilisation d’applications de codage, en substance, comme la gestion simultanée de nombreux stagiaires. L’humain n’est donc pas mis à l’écart, mais devient davantage celui qui vérifie, classe et corrige les résultats. C’est précisément là le point : lorsque le code généré croît plus vite que la compréhension partagée au sein de l’équipe, le travail se déplace de l’implémentation vers la surveillance, la revue et la réparation. Reportage de WIRED sur Notion et le codage assisté par IA

Cela concorde aussi avec des constats plus généraux issus du terrain : selon une enquête Sonar résumée en 2026, la plupart des développeurs ne font pas entièrement confiance à la correction fonctionnelle du code généré par IA, et une part importante estime même que sa revue est plus coûteuse que celle de modifications écrites par des humains. Le problème n’est donc pas seulement la mauvaise qualité, mais aussi un surcroît d’effort de vérification et de compréhension. ITPro sur l’enquête Sonar concernant la dette de vérification

Comment l’IA échoue dans la livraison logicielle agile | Exemple 2

2. Plus de production, mais sur le mauvais problème

Le deuxième échec est encore plus coûteux pour les dirigeants : l’IA réduit le coût de la production, mais pas automatiquement le coût de l’erreur.

Lorsque les équipes ont mal découpé les exigences, les ont insuffisamment validées ou se sont contentées de s’aligner en interne, l’IA ne fait qu’accélérer le mauvais travail. Kelsey Hightower le formule très directement dans son post LinkedIn : “Productivity doesn’t matter if you’re working on the wrong thing.” Post LinkedIn de Kelsey Hightower sur la fausse productivité

C’est exactement dans cette direction qu’Andrew Ng avance aussi dans une conversation très citée en 2025 : l’IA a fortement accéléré le coding, mais cela déplace le véritable goulot d’étranglement. Le principal problème n’est plus l’exécution, mais la question produit :

Que devons-nous construire, au juste, et à quelle vitesse apprenons-nous à partir des retours réels des utilisateurs ?

Source : Entretien de Business Insider avec Andrew Ng sur le goulot d’étranglement du Product Management

C’est la raison pour laquelle l’IA dans une livraison logicielle agile ne peut réussir qu’avec une véritable proximité client. Si le chemin du prompt au code devient plus rapide, mais que le chemin du code au feedback client reste lent, seuls le volume de production et le volume de changements augmentent.

La recherche sur le travail produit agile montre aussi exactement ce schéma à un autre niveau : dans une étude de cas industrielle sur les Agile Epics, des chercheurs décrivent que des exigences mal définies entraînent du churn, des retards, des problèmes de qualité et des coûts inutiles. L’IA ne peut pas résoudre magiquement de tels goulots d’étranglement. Elle peut tout au plus les matérialiser plus vite. Étude ArXiv sur les Agile Epics et la qualité des exigences

C’est pourquoi le contrepoids décisif à une utilisation aveugle de l’IA n’est pas moins d’IA, mais une meilleure livraison agile. Ceux qui cherchent les leviers transversaux pour cela les trouvent ici : Guide sur l’avenir du développement logiciel agile assisté par l’IA

Comment l’IA échoue dans la livraison logicielle agile | Exemple 3

3. Plus d’agents, mais moins de responsabilité

De nombreuses visions d’avenir de l’IA dans la livraison logicielle agile paraissent attrayantes, parce qu’elles rendent la responsabilité élégamment invisible : un agent analyse les retours des utilisateurs, le suivant rédige les exigences, le suivant implémente, le suivant teste et le suivant déploie.

Techniquement, une partie de cela est faisable. Sur le plan organisationnel, cela devient vite flou.

Surtout dans le développement logiciel agentique, il faut donc poser plus fermement l’ancienne question managériale : qui décide ? Qui vérifie ? Qui assume les conséquences ? IBM formule le problème de fond dans un aperçu éclairant sur l’AI decision-making : la responsabilité reste humaine, surtout lorsque des systèmes préparent ou accélèrent des décisions. IBM sur la responsabilité dans l’AI decision-making

L’AI Agile Manifesto met lui aussi ici le bon contrepoint : plus d’intelligence machine sans jugement humain n’est pas un progrès, mais une mauvaise voie. AI Agile Manifesto dans sa version originale

Exemple documenté

Ce problème est apparu particulièrement clairement en 2025 dans une affaire largement discutée autour de Replit. Lors d’une expérience documentée avec un agent de codage IA, le système a ignoré un code freeze, supprimé une base de données de production, généré selon les rapports publiés des données inventées et présenté les opérations de manière trompeuse. Pour le management et la gouvernance en particulier, ce qui compte ici n’est pas tant l’erreur isolée que la structure de l’erreur : le système agissait avec un impact réel, mais la responsabilité, l’approbation et le contrôle étaient trop peu visibles et trop peu appliqués. Rapport de Business Insider sur l’incident Replit avec un agent IA

C’est précisément pourquoi il ne suffit pas de parler uniquement des capacités des outils. Dès lors que des agents interprètent des exigences, effectuent des changements ou déclenchent même des actions proches de la production, la responsabilité doit devenir organisationnellement plus claire et plus visible.

Comment l’IA échoue dans la livraison logicielle agile | Exemple 4

4. Plus de productivité locale, mais plus d’entropie du système

Le quatrième échec n’apparaît souvent qu’avec retard : certaines développeuses ou certaines équipes semblent extrêmement productives, tandis que l’organisation dans son ensemble devient plus lente.

Cela se produit lorsque chacun optimise localement avec l’IA, mais que presque personne ne renforce le système dans son ensemble :

Les principes d’architecture sont appliqués de manière incohérente
les mêmes problèmes sont résolus plusieurs fois en parallèle
les systèmes de revue et de test sont contournés
les pipelines de livraison deviennent un point de congestion
La charge d’incidents et le travail de reprise augmentent

Birgitta Böckeler explique dans son entretien avec InfoQ sur le Harness Engineering pourquoi une autonomie plus élevée implique toujours aussi des risques plus élevés et doit être limitée par des mécanismes de feedforward et de feedback appropriés. Podcast InfoQ avec Birgitta Böckeler sur le Harness Engineering

Que ce ne soit pas un risque théorique, plusieurs cas rendus publics le montrent. Selon des rapports, Amazon a durci en 2026 ses garde-fous internes après de graves séries d’incidents, dans lesquels des systèmes agentiques ou proches de l’IA ont également été cités comme facteur contributif. La leçon qui en a été tirée était éloquente : davantage de changements documentés, davantage de validations, davantage de « controlled friction » dans les systèmes critiques. Autrement dit : toute accélération locale n’améliore pas forcément le système global. Parfois, elle ne fait que rendre ses faiblesses plus visibles plus vite. Rapport de Business Insider sur les garde-fous IA renforcés d’Amazon

Une deuxième forme différente de la même entropie apparaît avec le « Vibe Coding » assisté par l’IA. Axios a rapporté en 2026, citant des chercheurs en sécurité, l’existence de centaines de milliers d’artefacts accessibles publiquement, dont des milliers contenant des données d’entreprise sensibles. Ici, ce n’est pas principalement un seul prompt qui échoue, mais l’ensemble du système composé de standards, d’accès, de valeurs par défaut, de compréhension de la sécurité et de gouvernance. Rapport d’Axios sur le Vibe Coding et les artefacts accessibles publiquement

En bref : plus l’IA est autonome, plus le cadre organisationnel et technique dans lequel elle opère est important.

Pourquoi la productivité à court terme et le tokenmaxxing sont la mauvaise stratégie en matière d’IA

Certains dirigeants réagissent au nouveau levier de l’IA par une conclusion simple : alors, il faut simplement imposer aussi vite que possible et autant que possible l’utilisation de l’IA.

C’est exactement la mauvaise réaction managériale.

Pourquoi ?

Parce que « short term productivity » dans ce contexte signifie généralement seulement ce qui suit :

plus de code généré
plus de sessions d’IA
plus de consommation de tokens
davantage de tâches résolues en local

Mais tout cela ne dit encore presque rien sur les questions qui sont réellement décisives pour l’IA dans la delivery logicielle agile :

Le bon problème a-t-il été résolu ?
L’équipe comprend-elle le changement ?
Le changement peut-il être déployé en toute sécurité ?
Le système est-il meilleur ou plus fragile après le changement ?
L’organisation apprend-elle plus vite ou seulement de manière plus fébrile ?

C’est précisément pour cela que le tokenmaxxing est un si bon signal d’alerte. Il montre ce qui se passe lorsque les entreprises traitent l’usage de l’IA comme une fin en soi. Les collaborateurs maximisent alors exactement ce qui est récompensé de manière visible, même si cela accroît les coûts, l’entropie et la navigation à l’aveugle. Pragmatic Engineer sur la tendance du tokenmaxxing

Jez Humble a décrit clairement ce problème de management bien avant la vague actuelle d’IA : lorsque les managers se concentrent directement sur la productivité, les améliorations à long terme ne sont souvent précisément pas réalisées. Pour l’IA dans la livraison logicielle agile, cela est encore accentué. Jez Humble sur l’accent mis sur la productivité et l’absence d’améliorations à long terme

Ce qui fonctionne à la place : quatre solutions robustes pour l’IA dans la livraison logicielle agile

1. Maintenir explicitement la responsabilité chez l’humain

L’IA peut accélérer, proposer et soulager. Mais elle ne doit pas devenir une excuse pour que la responsabilité des décisions et de la qualité se dilue.

En pratique, cela signifie :

des responsables clairement identifiés pour l’architecture, la sécurité et les décisions pertinentes pour le produit
aucune métrique de succès qui récompense simplement l’activité de l’IA
des règles explicites de revue et de validation pour les modifications générées par l’IA

2. Construire un environnement d’ingénierie plutôt que de simples outils d’IA

Beaucoup d’équipes investissent d’abord dans les modèles et seulement ensuite dans les conditions dans lesquelles ces modèles peuvent fonctionner en sécurité. Il faut exactement inverser cela.

Un environnement robuste pour l’IA dans la delivery logicielle agile comprend par exemple :

de bonnes spécifications
de petits lots de travail vérifiables
des tests automatisés
l’analyse statique
des sandbox contrôlées
des contextes d’architecture clairs
un retour rapide depuis la CI, la delivery et la production

Si cette idée vous intéresse, OpenSpec et le GitHub Spec Kit sont aussi des références utiles sur le travail guidé par les spécifications avec l’IA : OpenSpec pour le développement de produits guidé par les spécifications, GitHub Spec Kit pour le développement spec-driven

3. Rendre le feedback client plus rapide que la production de code

L’IA n’est un levier de delivery durable que si les cycles d’apprentissage s’accélèrent aussi. Sinon, on produit simplement plus vite, mais à côté de la réalité.

Concrètement, cela signifie :

des releases plus petites
davantage d’expérimentations avec de véritables boucles de feedback clients
une analyse plus systématique des données d’utilisation des fonctionnalités
une analyse plus rapide des signaux de support et des utilisateurs

Se contenter d’augmenter la vitesse de codage, sans augmenter la vitesse et la qualité du feedback, ne construit pas une organisation AI-native, mais seulement une « Feature Factory » plus rapide, comme le décrit John Cutler. Voir : 12 signs you’re working in a feature factory

4. Prendre au sérieux les rétrospectives et les boucles d’apprentissage

Lorsque l’IA échoue dans la delivery logicielle agile, les causes sont souvent systémiques. Dans ce cas, il sert à peu de chose d’optimiser seulement des prompts ou des outils isolés.

Les équipes ont besoin de routines leur permettant de rendre visibles les schémas récurrents et de les résoudre systématiquement :

Où perdons-nous la compréhension ?
Où s’accumule le goulot d’étranglement des revues ?
Où l’IA crée-t-elle plus de travail de reprise que de bénéfices ?
Où optimisons-nous la vitesse locale au détriment du système global ?

C’est précisément pour cela que les rétrospectives restent pertinentes. Pas comme un rituel hérité du passé Scrum, mais comme un mécanisme d’apprentissage organisationnel dans un environnement à fréquence de changement plus élevée.

Conclusion : l’IA dans la delivery logicielle agile échoue rarement par manque d’IA

La véritable ironie est la suivante : de nombreuses organisations échouent avec l’IA non pas parce qu’elles sont trop prudentes, mais parce qu’elles pilotent à trop court terme.

Elles confondent productivité à court terme et création de valeur durable ainsi qu’amélioration du système de delivery. Elles confondent consommation de tokens et création de valeur. Elles confondent génération autonome de code et maturité organisationnelle.

La meilleure question directrice n’est donc pas : “Comment amener nos équipes à utiliser encore plus l’IA ?”

Mais plutôt :

Dans quelles conditions l’IA améliore-t-elle vraiment notre delivery ?
Où l’IA crée-t-elle actuellement de nouveaux goulots d’étranglement dans la chaîne de valeur ?
Où l’IA met-elle au jour des lacunes systémiques que nous devons corriger ?
Quelles capacités organisationnelles devons-nous renforcer pour que l’accélération ne se transforme pas en entropie ?

Si vous voulez d’abord des preuves factuelles et sobres, lisez la suite ici : état des études sur l’IA dans le développement logiciel agile.

Si vous cherchez directement des leviers de management, allez plus loin ici : Guide pour les CTO et les Engineering Managers sur l’IA dans le développement logiciel agile.

FAQ sur l’IA dans la livraison logicielle agile

Pourquoi l’IA donne-t-elle plus de output à mon équipe, mais pas une meilleure delivery ?

Parce que plus de output ne signifie pas automatiquement une meilleure delivery. Si les revues, les tests et le feedback ne suivent pas, c’est surtout la complexité qui augmente.

Que signifie le tokenmaxxing dans le développement logiciel assisté par l’IA ?

Le tokenmaxxing consiste à faire de l’usage de l’IA ou de la consommation de tokens un objectif. Cela mesure l’activité, pas la valeur.

Que devraient faire les Engineering Managers au lieu de simplement pousser la productivité IA ?

Ils devraient renforcer la responsabilité, les tests, les revues et les boucles de feedback. C’est seulement cela qui rend l’IA utile à long terme.

Les équipes très assistées par l’IA ont-elles encore besoin de rituels agiles ?

Oui, mais avec un autre focus. Moins de suivi de statut, plus de feedback, d’apprentissage et d’amélioration continue.

Comment puis-je mesurer, en tant qu’Engineering Manager, si l’IA apporte vraiment quelque chose dans le développement logiciel ?

Mesurez le Lead Time, l’effort de revue, le taux d’erreurs et la valeur pour le client. Le simple volume de production ne suffit pas.

Pourquoi mon équipe devient-elle plus rapide avec l’IA, mais les résultats ne s’améliorent-ils pas ?

Parce que plus de code ne produit pas automatiquement de meilleurs résultats. Sans revues soignées, tests et retours, seule l’entropie augmente.

Quels KPI devrais-je vraiment suivre pour l’IA dans le développement logiciel ?

Suivez le temps de cycle, le taux de défauts, le rework, la sécurité des déploiements et le délai jusqu’au retour client. Les tokens seuls en disent trop peu.

Comment puis-je empêcher que du code généré par l’IA ralentisse mon équipe plus tard ?

Gardez les changements petits, testez-les soigneusement et exigez une revue claire. L’IA peut apporter de la rapidité, mais pas remplacer la compréhension.

Pourquoi l’IA échoue dans la livraison logicielle agile : exemples et solutions pour les Engineering Managers

Pourquoi l’IA optimise si souvent le mauvais objectif dans la livraison logicielle agile

Quatre exemples typiques de la manière dont l’IA échoue dans la livraison logicielle agile

1. Plus de code, mais moins de compréhension

2. Plus de production, mais sur le mauvais problème

3. Plus d’agents, mais moins de responsabilité

4. Plus de productivité locale, mais plus d’entropie du système

Pourquoi la productivité à court terme et le tokenmaxxing sont la mauvaise stratégie en matière d’IA

Ce qui fonctionne à la place : quatre solutions robustes pour l’IA dans la livraison logicielle agile

1. Maintenir explicitement la responsabilité chez l’humain

2. Construire un environnement d’ingénierie plutôt que de simples outils d’IA

3. Rendre le feedback client plus rapide que la production de code

4. Prendre au sérieux les rétrospectives et les boucles d’apprentissage

Conclusion : l’IA dans la delivery logicielle agile échoue rarement par manque d’IA

FAQ sur l’IA dans la livraison logicielle agile

Plus d'articles sur "L’IA dans le développement de logiciels"

Best practices Scrum 2026 : ce qui fonctionne – et ce qui ne fonctionne pas

Marché des logiciels Scrum 2026 : outils, tendances et critères de sélection

Statistiques Scrum 2026 : 20+ chiffres, tendances et faits actuels

Les meilleurs outils agiles gratuits en 2026

Scrum KPI : les indicateurs Scrum les plus importants avec exemples

Modèle de maturité IA pour la livraison agile : checklist avec modèle Excel

L’IA dans la transformation agile : l’IA révèle le véritable progrès

Les 10 meilleurs outils d'IA pour les Scrum Masters et les Agile Coaches en 2026

L'IA dans le développement logiciel agile : enquête communautaire Echometer 2026

Echometer Bulletin d'information