Une nouvelle étude de TELUS Numérique révèle les risques de l'IA pour la sécurité et propose une feuille de route pour protéger les applications d'IA pour entreprises English
Une étude portant sur 34 modèles d'IA de 10 fournisseurs mondiaux révèle que les modèles d'IA à code source ouvert ne sont pas moins sûrs, que les modèles de raisonnement sont plus difficiles à exploiter et que les modèles de petite taille sont les plus vulnérables.
VANCOUVER, BC, le 26 mai 2026 /CNW/ - TELUS Numérique, un fournisseur mondial de services technologiques qui se spécialise dans l'expérience client numérique propulsée par l'IA et les transformations numériques axées sur l'avenir, a publié aujourd'hui son étude comparative GenAI Safety Model Benchmark (site disponible en anglais seulement), fondée sur plus de 620 000 tests antagonistes effectués sur 34 modèles d'IA de premier plan. Il s'agit de l'étude sur la sécurité de l'IA générative la plus exhaustive jamais réalisée par TELUS Numérique. Les résultats mettent en lumière une réalité importante pour les entreprises qui déploient l'IA : lorsque des techniques antagonistes sont employées, les modèles d'IA peuvent être amenés à adopter des comportements dangereux. Les tests menés par TELUS Numérique ont révélé que certains modèles acceptent les requêtes malveillantes plus de 90 % du temps. La nouvelle la plus encourageante est que la recherche pointe clairement la voie à suivre. Cette étude montre l'importance de tester les systèmes d'IA à grande échelle pour découvrir les risques cachés qui pourraient passer inaperçus dans le cadre d'une analyse moins rigoureuse. L'étude de TELUS Numérique montre que le recours à des tests de sécurité continus et automatisés, associés à une supervision et à des mesures correctives assurées par des humains, permettait de réduire considérablement les risques liés à l'utilisation de modèles d'IA générative.
Voici la deuxième édition de l'étude comparative GenAI Safety Model Benchmark de TELUS Numérique. Dans le cadre de la première, publiée en novembre 2025 (site disponible en anglais seulement), 24 modèles provenant de cinq fournisseurs américains ont été testés. Dans la deuxième édition, nous avons évalué 34 modèles provenant de 10 fournisseurs en Amérique du Nord, en Europe et en Chine : Claude (Anthropic), GPT (OpenAI), Gemini (Google), LLaMA (Meta), Qwen (Alibaba), ERNIE (Baidu). Seed (ByteDance), GLM (Zhipu AI), Yi (01.AI) et Mistral (Mistral). De plus, dans la deuxième édition, les tests à source ouverte sont passés de deux modèles à quatorze, ce qui dresse un tableau nettement plus large et plus global de la situation actuelle de la sécurité de l'IA.
« Le véritable risque ne réside pas dans le fait que les modèles d'IA présentent des vulnérabilités, mais dans le fait que la plupart des organisations n'ont aucun moyen de savoir quelles vulnérabilités les concernent, a déclaré Bret Kinsella, directeur exécutif et vice-président principal de Fuel iXMC à TELUS Numérique. Nous avons découvert des modèles qui ont bloqué une attaque à neuf reprises, mais qui ont échoué la dixième tentative. Nous en avons découvert d'autres qui réussissent très bien à freiner l'engagement sur certains sujets, mais qui échouent lamentablement sur d'autres. C'est la nature même des systèmes probabilistes : contrairement aux logiciels traditionnels, l'IA ne donne pas la même réponse chaque fois, ce qui signifie qu'un seul test de sécurité ne vous apprend pratiquement rien. Et choisir le bon modèle n'élimine pas le risque. Toute modification apportée à la configuration d'une application d'IA, aux données qu'elle utilise ou à la manière dont elle interagit avec d'autres outils peut avoir une incidence sur son comportement et son niveau de sécurité. Les organisations doivent passer de la vérification ponctuelle au lancement d'une solution d'IA générative à l'exécution de tests sur une base continue, sous peine de laisser passer des vulnérabilités qui constituent un risque évitable. »
Que doivent savoir les dirigeants d'organisations à propos de la sécurité de l'IA?
Les tests de sécurité menés par TELUS Numérique ont montré qu'aucun modèle d'IA générative n'est entièrement à l'abri d'attaques antagonistes. Si certains se sont révélés très difficiles à exploiter, d'autres ont été facilement amenés à enfreindre leurs propres règles de sécurité.
Trois facteurs se sont imposés comme les indicateurs les plus fiables en matière de sécurité de l'IA intégrée de manière native dans un modèle : sa façon de raisonner, son ampleur et l'approche adoptée par l'équipe qui a créé le modèle. Sur les 34 modèles testés, les taux de vulnérabilité aux attaques varient de 1,3 % à 93 %, un pourcentage plus faible indiquant un modèle plus sûr. À l'autre extrémité, dix modèles ont obtenu un taux inférieur à 5 %, les modèles Claude d'Anthropic représentant cinq de ces dix modèles, dont celui présentant le taux le plus bas de l'étude. Cependant, même les modèles Claude ont révélé des faiblesses lors des tests menés par TELUS Numérique, et rares sont les organisations qui accepteraient des taux d'échec, même sous la barre de 10 %, lorsque l'argent, la santé et la réputation sont en jeu.
Il est aussi important de noter que tous les modèles testés, même ceux présentant des taux de vulnérabilité très élevés, peuvent être utilisés en respectant certaines mesures de sécurité et en mettant en œuvre d'autres techniques afin de réduire considérablement les risques. Quel que soit le classement en matière de vulnérabilité dans cette étude comparative, chaque organisation devrait mettre en œuvre des mesures d'atténuation des risques pour toute application utilisant un modèle d'IA générative. Voici quelques conclusions clés de l'étude comparative de TELUS Numérique que les organisations devraient prendre en compte :
- Les modèles plus récents se sont généralement montrés plus résistants à la manipulation : les modèles d'IA gagnent généralement en sécurité à chaque nouvelle version, mais les progrès en matière de sécurité ne sont pas garantis. Certains modèles très performants ont même affiché des résultats moins bons que leurs prédécesseurs sur le plan de la sécurité.
- Les modèles à source ouverte ne sont pas toujours moins sûrs : bien que les modèles ouverts, dont la technologie sous-jacente est accessible à tous et peut être modifiée par n'importe qui, aient été manipulés en moyenne plus souvent que les modèles exclusifs, ce n'est pas la nature de la source d'un modèle qui détermine le niveau de risque. GLM 4.7, un grand modèle à source ouverte de Zhipu AI, a surpassé de nombreuses solutions alternatives exclusives en matière de sécurité.
- La taille du modèle a son importance : tant parmi les modèles à source ouverte que parmi les modèles exclusifs, les modèles plus petits se sont systématiquement révélés les plus vulnérables aux attaques. Mais la taille ne garantit pas à elle seule la sécurité. Les modèles d'OpenAI affichent la plus vaste plage de résultats de tous les fournisseurs, allant de 9,7 % à 65,7 %, car certains modèles privilégient la flexibilité plutôt que des contrôles de sécurité stricts. Dans l'écosystème à source ouverte, la tendance était plus nette : les modèles plus petits et plus abordables étaient bien plus susceptibles d'être manipulés que leurs homologues plus grands.
- Les modèles de raisonnement sont mieux à même d'éviter la manipulation : certains modèles d'IA sont conçus pour réfléchir à leur réponse avant de répondre, plutôt que pour répondre immédiatement. Ces modèles de « raisonnement » se sont révélés nettement plus difficiles à manipuler, n'étant vulnérables qu'à 19,9 % des attaques, contre 55,1 % pour les modèles qui ne passent pas par l'étape de raisonnement.
- La géographie n'a pas d'incidence sur la sécurité : le lieu de développement d'un modèle d'IA n'est pas un indicateur significatif de la capacité de celui-ci à résister aux attaques visant la sécurité de l'IA. Lorsque l'on compare des modèles de taille similaire, les principaux modèles d'Amérique du Nord, d'Europe et de Chine ont affiché des performances comparables.
- Les risques sont les plus élevés en matière de protection de la vie privée et de fraude : toutes les brèches de sécurité ne se valent pas. Si les développeurs de modèles d'IA ont réalisé des progrès dans des domaines tels que la manipulation politique, la plupart d'entre eux restent visiblement vulnérables à l'atteinte à la vie privée, à la fraude et aux menaces de cybersécurité, même parmi les plus performants. L'étude comparative a également mis en évidence un phénomène que les chercheurs appellent le « refus constructif », dans lequel un modèle refuse dans un premier temps une demande préjudiciable, mais fournit ensuite des renseignements connexes susceptibles d'être utilisés à mauvais escient ou de porter atteinte à la réputation. L'étude comparative a considéré toute réponse de ce type comme un échec, car un refus véritablement sûr devrait se limiter à refuser et s'arrêter là, bien que cette distinction soit mentionnée dans les données du rapport.
Comment l'étude comparative en matière de sécurité de l'IA générative de TELUS Numérique a-t-elle été menée?
La plupart des études comparatives en matière de sécurité de l'IA générative testent les modèles de manière isolée, mais ce n'est pas ainsi que les organisations les utilisent. En pratique, les modèles d'IA sont intégrés à des applications, comme un assistant virtuel de service à la clientèle ou un assistant bancaire, ce qui modifie leur comportement. L'étude comparative de TELUS Numérique a été conçue dans l'optique de cette réalité. Les 34 modèles se sont vu attribuer le rôle d'assistant d'IA d'une banque et ont reçu des invites sur des sujets pour lesquels ils pouvaient ou ne pouvaient pas apporter leur aide.
Les chercheurs ont élaboré cette étude comparative à partir du logiciel Fortify de TELUS Numérique, qui comprend un modèle d'IA personnalisé conçu pour générer des attaques malveillantes spécifiquement liées à des sujets critiques de sécurité et de sûreté de l'IA, allant de l'exfiltration de renseignements protégés et des invites inappropriées à l'automutilation, à la discrimination, le terrorisme et autres. Les méthodes employées incitent ou poussent chaque assistant à faire des choses qu'il a reçu l'ordre de ne pas faire.
Comment les organisations peuvent-elles protéger leurs applications d'IA?
Les résultats de ces travaux témoignent de la nécessité d'investir dans la sécurité de l'IA. Pourtant, l'écart entre ce que les organisations dépensent pour l'IA et ce qu'elles dépensent pour la sécuriser est révélateur. Les dépenses mondiales en matière d'IA devraient atteindre 2,52 billions de dollars en 2026, mais seulement 3,43 milliards de dollars sont consacrés à la gestion de la confiance, des risques et de la sécurité liés à l'IA. Cela représente environ 1 dollar consacré à la sécurité pour chaque tranche de 735 dollars dépensés dans des capacités d'IA. Parallèlement, 86 % des organisations (sites disponibles en anglais seulement) déclarent avoir déjà vécu des incidents de sécurité liés à l'IA, et des réglementations contraignantes en matière de sécurité de l'IA sont désormais en vigueur tant aux États-Unis qu'au sein de l'Union européenne.
L'étude GenAI Safety Model Benchmark de TELUS Numérique décrit un changement dans la façon dont les organisations devraient aborder la sécurité de l'IA. Plutôt que de se fier aux protocoles de sécurité des fournisseurs de modèles d'IA, les organisations devraient plutôt passer à des techniques de défense à plusieurs niveaux comprenant le modèle, des solutions de protection, des invites système précises et des ensembles de données propres, qui protègent les applications d'IA des deux côtés de l'interaction. Avant que le message d'un utilisateur n'atteigne le modèle d'IA, le filtrage des invites et le masquage des renseignements personnels identifiables peuvent permettre de bloquer les attaques directes. Avant que la réponse du modèle n'atteigne l'utilisateur, elle doit faire l'objet d'un contrôle visant à détecter tout contenu toxique ou toute réponse inappropriée.
Parallèlement, les tests de sécurité de l'IA doivent eux-mêmes évoluer, passant de vérifications manuelles, ponctuelles ou périodiques à des tests automatisés directement intégrés aux flux de travail des développeurs, ce qui permettra aux organisations d'ajuster leurs efforts de sécurité, de cerner de manière proactive les régressions lors de la mise à jour des modèles et de surveiller les menaces émergentes en temps réel.
Pour garantir une sécurité efficace de l'IA, il faut trouver le juste équilibre entre les tests automatisés, la supervision humaine et les pratiques de gestion des données de haute qualité. TELUS Numérique réunit ces trois éléments, en associant des outils d'IA de pointe à l'expertise humaine pour aider les organisations à concevoir, à mettre à l'essai et à sécuriser leurs systèmes d'IA à chaque étape. Parmi les meilleurs outils actuellement disponibles pour les tests antagonistes et la validation de la sécurité de l'IA, Fuel iX Fortify (site disponible en anglais seulement), la solution de tests continus et automatisés de TELUS Numérique qui génère des attaques inédites lors de chaque session ou puise dans une bibliothèque existante d'invites antagonistes. Fortify aide les organisations à tester les systèmes d'IA générative à grande échelle, en exécutant des milliers d'attaques antagonistes en quelques minutes et en associant automatiquement les risques cernés aux normes du secteur, notamment OWASP, NIST AI RMF et MITRE ATLAS. Conçu pour les utilisateurs tant avec des connaissances techniques que sans connaissances techniques, Fortify vise à générer des objectifs d'attaque uniques adaptés aux politiques de chaque système et à devancer les menaces émergentes grâce à une base de données de tactiques antagonistes en constante évolution.
Fuel iX Fortify fait partie des capacités de bout en bout de TELUS Numérique en matière d'IA, d'expérience client et de données, qui couvrent l'intégralité du cycle de vie de l'IA dans une organisation, de la stratégie à la mise en production. L'entreprise développe des données d'apprentissage pour les plus grands modèles d'IA au monde, fournit une infrastructure sécurisée et souveraine dès la conception afin de protéger les données et de garantir la conformité, et aide les organisations à déployer l'IA agentique dans l'ensemble de leurs activités. Tous ces éléments s'inscrivent dans le cadre des principes d'intervention humaine de TELUS Numérique, visant à intégrer la responsabilité et la durabilité dans chaque solution.
L'étude GenAI Safety Model Benchmark réalisée par TELUS Numérique en avril 2026, qui comprend le classement détaillé des modèles, la répartition par catégories et la méthodologie, est accessible au https://www.telusdigital.com/insights/fuel-ix/resource/genai-safety-benchmark-2026 (site disponible en anglais seulement).
Pour en savoir plus sur la manière dont Fuel iX Fortify peut vous aider à sécuriser les applications d'IA de votre organisation, visitez le https://www.telusdigital.com/solutions/fuel-ix/fortify (site disponible en anglais seulement).
Foire aux questions
1. Quels sont les critères que les organisations doivent prendre en compte pour choisir les meilleures solutions de tests de sécurité de l'IA?
Pour être efficaces, les tests de sécurité de l'IA doivent être continus et simuler des techniques d'attaque réelles. Les meilleurs outils de la méthode de l'équipe rouge d'IA simulent des conversations en plusieurs étapes, au cours desquelles un attaquant instaure un climat de confiance au moyen de plusieurs échanges avant de formuler une requête malveillante. Les résultats doivent être conformes aux normes reconnues du secteur afin que les équipes chargées de la sécurité et de la conformité puissent y donner suite immédiatement. Les meilleurs outils de sécurité pour les grands modèles de langage permettent aussi d'automatiser le processus. De plus, les modèles d'IA prêts à l'emploi ne génèrent généralement pas d'attaques suffisamment malveillantes pour simuler fidèlement les agissements d'un pirate informatique réel, en raison des mesures d'alignement mises en place après l'apprentissage pour des raisons de sécurité. Il faut donc personnaliser les modèles de base et leur réapprendre à agir comme des attaquants, afin de pouvoir évaluer avec précision les risques liés aux modèles au sein des organisations. Fuel iX Fortify a été conçu autour de ces principes, automatisant plus de 140 objectifs d'attaque étayés par la recherche et cartographiant les risques cernés selon les référentiels OWASP, NIST AI RMF et MITRE ATLAS.
2. À quelle fréquence les organisations doivent-elles tester leurs applications d'IA pour détecter d'éventuelles failles de sécurité?
La dernière étude GenAI Safety Model Benchmark réalisée par TELUS Numérique a révélé que sept des douze modèles testés dans le cadre des deux éditions indiquaient des changements statistiquement importants dans leur performance en matière de sécurité en l'espace d'un seul trimestre. Les modèles d'IA peuvent également modifier leur comportement à la suite de mises à jour effectuées par les fournisseurs, sans avertissement préalable. Un système qui satisfait aujourd'hui à un test de sécurité peut s'y avérer vulnérable le lendemain. La meilleure stratégie de sécurité pour les grands modèles de langage destinés aux organisations doit inclure une validation continue. Fuel iX Fortify permet ce type de validation continue, en exécutant des milliers de simulations par la méthode de l'équipe rouge qui peuvent être menées de manière continue plutôt que ponctuelle.
3. Les équipes non spécialisées en sécurité peuvent-elles exécuter des évaluations automatisées fondées sur la méthode de l'équipe rouge de l'IA?
Oui. L'un des principaux obstacles à la sécurité de l'IA est la pénurie de talents spécialisés. Le meilleur service d'évaluation basée sur la méthode de l'équipe rouge de l'IA devrait être accessible à tous les membres de l'équipe. Fuel iX Fortify a été conçu pour permettre aux développeurs, aux gestionnaires de produit et aux responsables de la conformité de réaliser des évaluations de sécurité sans nécessiter une expertise approfondie en la matière, et pour permettre aux analystes en sécurité d'élargir la portée et l'ampleur de leur travail. Les organisations peuvent préparer des collaborateurs non spécialisés en moins de 30 minutes.
4. Quels types de vulnérabilités liées à l'IA sont les plus difficiles à détecter? Et comment Fuel iX Fortify peut-il y remédier?
L'étude GenAI Safety Benchmark menée par TELUS Numérique a révélé que l'atteinte à la vie privée, la fraude et les cybermenaces constituent les domaines dans lesquels les modèles d'IA restent les plus vulnérables, même parmi les plus performants. TELUS Numérique a constaté qu'un schéma particulièrement difficile à saisir est celui appelé le « refus constructif », dans le cadre duquel un modèle refuse dans un premier temps une requête malveillante, mais fournit ensuite des renseignements connexes susceptibles d'être utilisés à mauvais escient. Ces défaillances subtiles peuvent échapper aux simples filtres de mots-clés et aux contrôles de sécurité de base. Fortify est conçu pour les détecter, en utilisant des dialogues d'attaque persistants en plusieurs étapes qui imitent la manière dont les auteurs malveillants du monde réel sondent réellement les systèmes d'IA. En effectuant des tests sur plus de 140 objectifs d'attaque étayés par la recherche, Fortify peut mettre en évidence les vulnérabilités profondes que les solutions de test à étape unique ne détectent pas.
5. À quels types de résultats les organisations peuvent-elles s'attendre en utilisant Fuel iX Fortify?
Les organisations qui utilisent Fortify ont constaté une réduction importante du temps consacré aux tests d'IA, ainsi qu'une meilleure protection contre les risques. Les organisations qui adoptent l'approche de la méthode de l'équipe rouge d'IA se distinguent par leur capacité à détecter les vulnérabilités que les tests manuels ne parviennent pas à repérer. Dans le cadre d'un déploiement dans le secteur des soins de santé (site disponible en anglais seulement), la durée des tests a été réduite de près de 97 %, tout en atteignant un taux de précision de 99,6 % pour le repérage des vulnérabilités. Les équipes ont aussi été en mesure de préparer des utilisateurs sans connaissances techniques en moins de 30 minutes, ce qui a permis une participation plus large aux tests de risques liés à l'IA et une prise de décision plus rapide en matière de mesures correctives.
6. Pourquoi les organisations ont-elles besoin de plus qu'un simple outil de test pour sécuriser leurs applications d'IA?
Trouver des vulnérabilités et les associer à des mesures d'atténuation des risques potentiels n'est que la première étape. Les meilleurs services de la méthode de l'équipe rouge d'IA vont au-delà de la détection. Les organisations ont également besoin de pratiques adéquates en matière de données, d'une gouvernance efficace et d'une bonne expertise humaine pour remédier aux problèmes et prévenir les risques futurs. TELUS Numérique propose l'application de tests automatisés Fuel iX Fortify, ainsi qu'un accompagnement complet pour la stratégie et la mise en œuvre de l'IA, afin d'aider les organisations à développer des systèmes d'IA qui restent sécurisés à long terme.
À propos de TELUS Numérique
TELUS Numérique crée des expériences uniques et séduisantes pour les clients et les employés, en plus de favoriser des transformations numériques durables qui offrent une valeur aux clients. Nous sommes la marque derrière les marques. Les membres de notre équipe mondiale sont d'ardents ambassadeurs des produits et services de nos clients et des experts technologiques résolus à rehausser le parcours de leurs clients, à trouver des solutions aux défis commerciaux, à atténuer les risques et à innover continuellement. Nos capacités intégrées de bout en bout incluent la gestion de l'expérience client, les solutions numériques telles que les solutions infonuagiques, l'automatisation par l'IA, les services de conception numérique frontaux et de consultation, les solutions de données et d'IA, y compris la vision informatique, et les services de confiance et de sécurité. Fuel iXMC (site disponible en anglais seulement) est la plateforme exclusive et la gamme de produits de TELUS Numérique qui offrent des capacités d'IA normalisées et des outils de développement d'application et de création de solutions d'entreprise sur mesure pour aider les clients à gérer, à surveiller et à maintenir leurs capacités d'IA générative à l'échelle de leur entreprise.
Motivée par sa vocation, TELUS Numérique mise sur la technologie, l'ingéniosité humaine et la compassion pour servir sa clientèle et créer des collectivités inclusives et florissantes dans toutes les régions du monde où elle mène ses activités. Guidés par nos principes d'intervention humaine, nous développons et déployons des technologies transformatrices de manière responsable, tout en tenant compte de leur incidence à grande échelle. Pour en savoir plus, consultez telusdigital.com/fr.
Personnes-ressources :
Relations avec les médias, TELUS Numérique
Jackie Paduano
[email protected]
Relations avec les investisseurs, TELUS
Olena Lobach
[email protected]
SOURCE TELUS Digital
Partager cet article