Souveraineté d’un modèle d’IA : 7 critères pour évaluer (et ne pas se faire avoir)

Vous voulez basculer sur une “IA souveraine” pour votre entreprise, et vous tapez “Mistral AI” dans Google parce que c’est la première marque française qui vous vient en tête. Mais la souveraineté d’un modèle d’IA ne se résume pas à la nationalité de l’entreprise qui le commercialise. En 2026, avec l’AI Act qui entre en pleine application le 2 août, et le Cloud Act américain qui reste une menace pour les données hébergées par les géants US, l’enjeu est plus complexe. Voici une grille de lecture en 7 critères concrets pour évaluer la souveraineté réelle d’un modèle d’IA, et un score pour vous aider à comparer les options.

L’objectif n’est pas de vous vendre un fournisseur plutôt qu’un autre. C’est de vous donner les bons critères pour décider vous-même, en fonction de votre secteur, de votre taille, et du niveau de sensibilité des données que vous manipulez. Car toutes les entreprises n’ont pas les mêmes contraintes : une start-up early stage qui fait du chat aura des besoins très différents d’une banque qui doit se conformer à HDS, PCI DSS et aux exigences de l’ACPR.

🛡️

L’essentiel en 30 secondes

  • Souveraineté ≠ nationalité : un modèle “français” entraîné sur des GPU américains avec du capital néerlandais n’est pas 100% souverain.
  • 7 critères à vérifier : siège social, actionnariat, lieu d’entraînement, lieu d’inférence, exposition au Cloud Act, licences, open source.
  • AI Act 2 août 2026 : à partir de cette date, la transparence et la classification des risques deviennent obligatoires.
  • 3 niveaux de souveraineté : marketing (100% revendiqué), réel (60-80%), absolu (rare, on-premise strict).
  • Le bon réflexe : faire un audit interne, identifier la sensibilité des données, puis choisir le niveau de souveraineté adapté.
  • Le piège à éviter : confondre “souverain” et “européen” : un modèle hébergé en Irlande reste soumis au Cloud Act.

Pourquoi “souveraineté” ne veut pas dire grand-chose tout seul

Le mot “souveraineté” est devenu l’argument marketing numéro un des fournisseurs d’IA en Europe. Il est décliné à toutes les sauces : IA souveraine, cloud souverain, data center souverain, GPU souverain. Mais dans la plupart des cas, il s’agit d’un abus de langage. La souveraineté numérique est un spectre, pas un statut binaire. Il y a la souveraineté revendiquée (celle du marketing), la souveraineté réelle (celle qu’on peut vérifier), et la souveraineté absolue (quasiment introuvable en pratique).

Pour bien comprendre, prenons l’exemple de Mistral AI, souvent présenté comme le champion français de l’IA souveraine. Le siège est à Paris, les fondateurs sont français, et une partie de l’inférence sera opérée en France. Mais le capital n’est pas 100% français : ASML (néerlandais) est premier actionnaire avec 11% du capital, NVIDIA (américain) est au capital, Andreessen Horowitz (américain) aussi. L’entraînement s’est fait sur des GPU NVIDIA, avec des machines ASML pour la lithographie des puces. Quant à l’hébergement d’une partie de l’infrastructure cloud, il s’appuie sur Microsoft Azure pour certains services.

Cela fait-il de Mistral une “IA non souveraine” ? Non. Mais cela relativise l’argument. C’est une IA plus souveraine qu’OpenAI ou Anthropic, mais pas 100% souveraine. C’est un compromis, et c’est très bien ainsi. L’important, c’est d’avoir les outils pour mesurer ce compromis, et de savoir si ce niveau correspond à vos contraintes.

⚠️ Les 3 pièges classiques du marketing “souverain”

  • “Français” = “souverain” : un modèle entraîné sur des GPU américains, hébergé chez AWS, et dont les données transitent par les USA n’est pas souverain, même si l’entreprise a son siège à Paris.
  • “Européen” = “souverain” : un modèle hébergé en Irlande reste soumis au Cloud Act américain, qui s’applique aux entreprises US, où qu’elles soient. AWS Dublin, Azure Netherlands, Google Belgium : tous concernés.
  • “Open source” = “souverain” : un modèle open source comme Llama ou Qwen n’est pas plus souverain qu’un modèle fermé. Vous pouvez le télécharger, mais vous dépendez toujours d’une supply chain matérielle et logicielle étrangère.

✅ Les 3 marqueurs d’une vraie souveraineté

  • Opéré sous juridiction européenne : l’inférence et l’entraînement se font dans des data centers situés dans l’UE, avec des opérateurs eux-mêmes européens et non soumis au Cloud Act.
  • Capital maîtrisé : les principaux investisseurs ne sont pas soumis à des juridictions extraterritoriales, et il existe un mécanisme de blocage en cas de prise de contrôle hostile.
  • Transparence sur la chaîne : le fournisseur communique clairement sur le lieu d’entraînement, le lieu d’inférence, les sous-traitants, et les flux de données.

Les 7 critères pour évaluer la souveraineté d’un modèle d’IA

Voici une grille d’évaluation en 7 critères, à pondérer selon votre contexte. Chaque critère peut être noté de 0 à 3, pour un score total sur 21. Ce n’est pas une science exacte, mais c’est un bon point de départ pour objectiver un débat souvent idéologique.

⚠️ Méthodologie : noter chaque critère de 0 à 3

0 point : critère non rempli, ou absence de transparence. 1 point : partiellement rempli, ou transparence partielle. 2 points : rempli mais avec des zones d’ombre. 3 points : rempli intégralement, transparence totale, vérifiable indépendamment.

Un score de 18-21 indique une souveraineté réelle, vérifiable et auditable. Un score de 12-17 indique une souveraineté correcte, avec quelques compromis. Un score inférieur à 12 indique une souveraineté essentiellement marketing.

Attention : le score seul ne suffit pas. Une banque manipulant des données HDS aura besoin d’un score de 21. Une start-up early stage pourra se contenter d’un score de 12. Tout dépend de votre secteur et de la sensibilité de vos données.

1. Siège social et juridiction de l’entreprise

Le premier réflexe, c’est de regarder où l’entreprise est juridiquement immatriculée. Si elle est en France ou dans l’UE, elle est soumise au RGPD, à l’AI Act, et aux juridictions européennes. Si elle est aux États-Unis, elle est soumise au Cloud Act et au Patriot Act, ce qui permet aux autorités US d’exiger l’accès à ses données, y compris celles hébergées en Europe.

Notez bien que c’est la nationalité de l’entreprise qui compte, pas celle du data center. AWS Dublin, c’est des serveurs en Irlande, mais AWS est une entreprise américaine, donc soumise au Cloud Act. C’est le piège classique.

2. Composition de l’actionnariat

Un actionnaire majoritaire soumis à une juridiction extra-européenne (US, Chine, Russie) peut, en théorie, exiger l’accès aux données, bloquer certaines opérations, ou forcer une cession à un acteur hostile. Ce risque est faible en pratique (les fonds de pension n’ont pas les compétences techniques pour fouiller dans des bases de données), mais il existe.

Pour limiter ce risque, certains fournisseurs comme OVHcloud ont mis en place des “statuts de société européenne” avec des clauses de blocage en cas de prise de contrôle hostile par un acteur extra-européen. C’est un signal positif, à vérifier dans les statuts.

3. Lieu d’entraînement du modèle

Quand vous faites une requête d’inférence, vous envoyez une donnée à un modèle déjà entraîné. Mais le modèle lui-même a été construit à partir de données d’entraînement qui ont transité par des serveurs, parfois situés hors UE. Si l’entraînement a été fait sur AWS US, il y a de fortes chances que les données d’entraînement (et les métadonnées associées) soient restées sur des serveurs américains.

Pour vérifier, demandez au fournisseur : “Où ont été entraînés vos modèles ?” et “Quelles données ont été utilisées ?”. Un fournisseur transparent vous donnera une réponse détaillée. Un fournisseur évasif vous donnera du marketing.

4. Lieu d’inférence

L’inférence, c’est le moment où vous interrogez le modèle. C’est là que transitent vos prompts et les réponses. Si l’inférence est hébergée en France, vos données ne quittent pas le territoire national. Si elle est hébergée aux Pays-Bas, elles restent dans l’UE mais pas forcément en France. Si elle est hébergée aux États-Unis, elles sont soumises au Cloud Act.

Pour les modèles déployés en API publique (Mistral, OpenAI, Anthropic), le lieu d’inférence est souvent configurable : vous pouvez choisir la région (Europe, US, Asie). Pour les modèles on-premise, c’est par définition chez vous, ce qui est le maximum de souveraineté.

5. Exposition au Cloud Act et au FISA

Le Cloud Act (2018) permet aux autorités américaines d’exiger l’accès aux données stockées par des entreprises américaines, y compris en Europe. Le FISA (1978) permet la surveillance étrangère. Ces deux lois s’appliquent à toute entreprise de droit américain, où qu’elle opère et où qu’elle stocke les données.

Pour savoir si un fournisseur y est soumis, c’est simple : est-il une entreprise de droit américain ? Si oui, il y est soumis, qu’il soit hébergé à Seattle ou à Strasbourg. Les sous-traitants comptent aussi : si votre fournisseur utilise AWS ou Azure pour une partie de son infrastructure, les données hébergées chez ces sous-traitants sont également concernées.

6. Licences et propriété intellectuelle

Un modèle “open source” vous donne plus de contrôle qu’un modèle fermé. Vous pouvez auditer le code, l’adapter, le déployer on-premise. Mais “open source” ne veut pas dire “souverain” : Llama de Meta est open source, mais Meta est une entreprise américaine soumise au Cloud Act. Vous pouvez télécharger le modèle, mais vous ne pouvez pas empêcher Meta de mettre à jour les conditions d’utilisation.

Pour les modèles fermés, la question de la propriété intellectuelle est encore plus sensible. Qui possède les poids du modèle ? Qui peut les modifier ? Qui peut les dupliquer ? Un fournisseur qui externalise l’entraînement chez un acteur non-européen n’a pas le même niveau de contrôle qu’un fournisseur qui maîtrise toute la chaîne.

7. Transparence et auditabilité

Le dernier critère, et le plus subjectif, c’est la transparence du fournisseur. Un fournisseur qui publie un rapport de transparence détaillé, qui accepte les audits indépendants, qui documente ses sous-traitants, qui communique sur les incidents, est plus fiable qu’un fournisseur qui se contente d’affirmer sa souveraineté sans preuve.

Pour vérifier, quelques questions concrètes à poser : “Quel est votre rapport de transparence annuel ?”, “Acceptez-vous un audit SOC 2 ou ISO 27001 ?”, “Quel est votre plan de gestion des demandes d’accès par les autorités ?”, “Communiquez-vous publiquement sur les incidents de sécurité ?”. Un fournisseur de qualité répondra sans détour.

Critère Question à poser Note /3
1. Siège social L’entreprise est-elle immatriculée dans l’UE ? 0 à 3
2. Actionnariat Les investisseurs majoritaires sont-ils européens ? 0 à 3
3. Entraînement Le modèle a-t-il été entraîné dans l’UE ? 0 à 3
4. Inférence L’inférence est-elle opérée dans l’UE ? 0 à 3
5. Cloud Act Le fournisseur est-il soumis au Cloud Act ? 0 à 3
6. Licences Le modèle est-il open source ou auditable ? 0 à 3
7. Transparence Le fournisseur publie-t-il un rapport de transparence ? 0 à 3

Application pratique : comparez les options du marché

Pour illustrer, voici comment on peut noter les principaux modèles accessibles aux entreprises françaises en 2026. Attention, ce scoring est indicatif et dépend des informations publiques disponibles à la date de rédaction. Il évoluera avec les futures annonces et acquisitions.

📊 Grille comparative indicative (juin 2026)

Mistral AI 15-17 / 21

Siège Paris, actionnariat mixte (ASML, NVIDIA, Bpifrance), entraînement UE, inférence UE/USA selon option, exposition partielle Cloud Act via sous-traitants, modèles mixtes (open + propriétaire), transparence correcte. Compromis intéressant mais pas absolu.

OpenAI (ChatGPT, GPT-5) 3-5 / 21

Société américaine, entraînée et inférée aux USA, pleinement soumise au Cloud Act et au FISA, modèles fermés, transparence en progression. Pas de souveraineté réelle, mais les performances restent la référence du marché.

Anthropic (Claude) 3-5 / 21

Société américaine, mêmes contraintes qu’OpenAI. Souveraineté quasi-nulle. Points forts : safety by design, modèles réputés pour leur raisonnement et leur fiabilité.

OVHcloud (IA) 17-19 / 21

Société française, capital contrôlé (fonds européen, statut de société européenne), inférence en France, modèles distribués (Mistral, Llama, etc.), rapport de transparence publié. Probablement l’offre la plus souveraine du marché en 2026.

Scaleway 15-17 / 21

Société française (filiale d’Iliad), inférence en France, modèles hébergés Mistral et LLaMA, transparence en progression. Bon compromis souveraineté/prix.

Modèles on-premise (Llama, Mistral, Qwen) 20-21 / 21

Déployés sur vos propres serveurs, dans votre data center, sans connexion internet. Souveraineté maximale, mais coût élevé, compétences techniques requises, et modèles moins bons que les API du marché.

Quel niveau de souveraineté pour quel cas d’usage ?

Le bon niveau de souveraineté dépend de votre secteur, de votre taille, et du type de données que vous manipulez. Voici un guide rapide pour vous positionner.

Si vous êtes une start-up early stage qui code des agents, qui n’a pas de données sensibles, et dont les clients sont B2B, vous pouvez vous contenter d’un score de 12-15 sur 21. OpenAI ou Anthropic sont des options valables, à condition de ne pas leur envoyer de données confidentielles.

Si vous êtes une ETI ou un grand groupe avec des données métier (propriété intellectuelle, données clients, données financières), visez un score de 15-18 sur 21. Mistral AI, OVHcloud ou Scaleway sont des options à privilégier. OpenAI et Anthropic restent possibles pour les usages non-sensibles.

Si vous êtes dans la santé, la défense, la banque, ou le secteur public, visez un score de 18-21 sur 21. OVHcloud avec SecNumCloud, ou des déploiements on-premise, sont les seules options réellement conformes. À partir du 2 août 2026, l’AI Act ajoute des obligations supplémentaires sur la transparence et la classification des risques.

Qu’est-ce que l’AI Act, et pourquoi c’est important ?

L’AI Act est le règlement européen sur l’intelligence artificielle, adopté en 2024 et qui entre en application progressive entre 2025 et 2027. À partir du 2 août 2026, la plupart de ses dispositions deviennent pleinement applicables. Il classe les systèmes d’IA par niveau de risque (interdit, haut risque, limité, minimal) et impose des obligations de transparence, de documentation et d’évaluation des risques systémiques pour les modèles de fondation.

Le Cloud Act, c’est quoi exactement ?

Le Cloud Act (Clarifying Lawful Overseas Use of Data) est une loi américaine de 2018 qui permet aux autorités américaines (FBI, NSA, etc.) d’exiger l’accès aux données stockées par des entreprises de droit américain, où qu’elles soient dans le monde. Cela inclut AWS, Azure, Google Cloud, mais aussi toute entreprise américaine, même si ses serveurs sont en Europe.

Mistral AI est-il vraiment souverain ?

Relativement. Le siège est à Paris, l’inférence sera en partie opérée en France, et Bpifrance est au capital. Mais ASML (néerlandais) est premier actionnaire, NVIDIA (américain) aussi, et l’entraînement s’est fait sur des GPU américains. C’est un compromis intéressant, à 15-17 sur 21 dans notre grille. Pour une souveraineté maximale, OVHcloud ou on-premise sont préférables.

Un modèle open source est-il plus souverain ?

Pas nécessairement. Open source signifie que vous pouvez auditer, modifier et déployer le modèle librement. Mais Llama est open source et Meta est une entreprise américaine, soumise au Cloud Act. La souveraineté dépend du lieu d’hébergement, pas de la licence. Pour une souveraineté maximale, déployez un modèle open source on-premise, dans votre data center.

Que change concrètement l’AI Act le 2 août 2026 ?

À partir de cette date, les modèles de fondation (GPT, Claude, Mistral, Llama, etc.) doivent respecter des obligations de transparence : documentation technique, résumé des données d’entraînement, classification des risques systémiques. Les modèles dépassant un certain seuil de calcul doivent aussi notifier les incidents graves, mettre en place du red teaming, et respecter des mesures de cybersécurité renforcées.

Comment auditer un fournisseur d’IA avant de signer ?

Demandez-lui son rapport de transparence, ses certifications (SOC 2, ISO 27001, SecNumCloud, HDS), la liste de ses sous-traitants, sa politique de gestion des demandes d’accès par les autorités, et un historique des incidents de sécurité publiés. Si le fournisseur refuse ou tarde à répondre, c’est un signal négatif fort.

Le coût d’une IA souveraine est-il vraiment prohibitif ?

Pas forcément. Pour une inférence simple, un modèle comme Mistral Medium 3.5 est facturé 1,5 dollar par million de tokens en entrée, ce qui est 30% moins cher que les modèles américains équivalents. Pour un déploiement on-premise, le coût initial est plus élevé (GPU, infrastructure, compétences), mais le coût marginal par requête est quasi-nul à long terme.

🧠 Quel niveau de souveraineté pour votre entreprise ?

1. Vous êtes dans quel secteur ?

La souveraineté n'est pas un argument marketing, c'est un arbitrage technique et juridique qui doit être documenté. Prenez le temps de cartographier vos données, d'identifier votre exposition réglementaire, et de noter les fournisseurs candidats sur les 7 critères de cet article. C'est un investissement modeste pour une tranquillité d'esprit à long terme, surtout à l'approche du 2 août 2026.

Alexi Tauzin
Alexi Tauzin 🛡️ Éditeur & Expert Cyber

Fondateur d’alexitauzin.com, entrepreneur digital et spécialiste des technologies connectées. Il décrypte les enjeux de la souveraineté numérique, de la protection des données et de la sécurité informatique pour rendre la cyber-vigilance accessible à tous.

Laisser un commentaire