Souveraineté6 mai 20269 min de lecture

L'IA apporte une productivité réelle. Où sont vos données quand vous collez un PDF dans le chat ?

OpenAI, Anthropic et Google ont rendu l'IA quotidienne, et la productivité est réelle. Mais chaque fois qu'un collaborateur colle un contrat, ces données traversent vers un serveur hors de l'UE. Pour la plupart, c'est acceptable. Pour certains secteurs, ce n'est plus le cas.

Il convient de commencer par ce qui est vrai et que personne ne discute ici : ChatGPT, Claude et Gemini ont fait quelque chose qu'il est difficile d'exagérer. Ils ont transformé l'IA en outil du quotidien — pour l'équipe marketing qui rédige un brief, pour le service juridique qui relit un contrat, pour le développeur qui demande des refactorings. La productivité qu'ils apportent est réelle, mesurable et, pour la plupart des entreprises, hors de doute. Cet article ne porte pas là-dessus.

Il porte sur ce qui se passe exactement au moment où un collaborateur appuie sur Entrée — un détail opérationnel que la plupart des organisations ne se sont pas arrêtées à regarder, et qui pour certaines est en train de devenir un problème.

Le voyage de la donnée quand vous appuyez sur Entrée

Quand vous collez un contrat, un bilan trimestriel, un email interne ou le PDF d'un appel d'offres dans l'un des assistants des grands fournisseurs, ce contenu voyage vers un datacenter hors de l'UE — typiquement aux États-Unis. La connexion est chiffrée en transit, certes, mais la résidence de la donnée (où elle vit, sous quelle juridiction elle est traitée) et l'usage qui en est fait une fois sur place sont des choses distinctes, régies par les CGU et la politique de confidentialité de chaque fournisseur.

Ce que les fournisseurs eux-mêmes documentent publiquement sur leurs produits grand public (pas leurs API payantes, qui ont des politiques différentes) :

Résidence de la donnée

Serveurs principaux hors de l'UE dans la plupart des cas. Des options de résidence européenne existent dans les formules entreprise — pas par défaut dans les formules individuelles ou d'équipe.

Utilisation pour l'entraînement

Activée par défaut sur les formules grand public (avec opt-out manuel). Désactivée par défaut sur les formules entreprise payantes — mais l'option de l'activer demeure et dépend de la configuration de l'administrateur.

Conservation des conversations

Habituellement 30 jours après suppression, conservées pour examen d'abus ou de sécurité — même lorsque le chat est supprimé.

Juridiction légale

Les entreprises américaines sont soumises au CLOUD Act (Clarifying Lawful Overseas Use of Data Act, 2018) — qui permet aux autorités américaines de demander des données stockées par des entreprises américaines, quel que soit l'emplacement physique des serveurs.

Rien de ce qui précède n'est un secret. Tout figure sur les pages de confidentialité de chaque fournisseur, accessible à qui souhaite les lire. Et pour l'immense majorité des entreprises, ce n'est pas un problème : les données envoyées ne sont pas sensibles, les fournisseurs sont sérieux, les politiques de sécurité sont robustes, et le compromis productivité-résidence penche clairement du côté de la productivité. C'est le cas normal.

Pour certaines entreprises, en revanche, ce n'en est pas un

Il existe un groupe d'organisations pour lesquelles ce compromis a cessé d'être confortable. Elles partagent deux caractéristiques : elles travaillent avec des données sensibles par nature, et elles opèrent sous des cadres réglementaires qui les rendent responsables du lieu où finit cette information. Principalement :

Administration publique nationale et régionale — données de citoyens, ENS Catégorie Moyenne ou Haute comme obligation.
Santé — historiques cliniques sous RGPD renforcé (article 9, données particulièrement protégées).
Défense et sécurité — classification nationale, dépendance à un fournisseur critique.
Banque, assurance et services financiers — DORA, secret bancaire, supervision BCE / Banque d'Espagne.
Secteurs juridiques — secret professionnel avocat-client, confidentialité des procédures en cours.
Industrie pharmaceutique — propriété intellectuelle d'essais cliniques, formulations, dossiers réglementaires.

Pour ces secteurs, la question « où ceci est-il traité ? » n'est pas un détail technique — c'est une réponse que le régulateur peut leur demander par écrit. Et c'est une réponse devenue plus exigeante ces derniers mois avec l'application effective de NIS2 (transposition espagnole dans le décret-loi royal 7/2025), du règlement européen sur l'IA (entrée en vigueur échelonnée 2025-2026) et du relèvement du niveau de l'ENS vers les catégories Moyenne et Haute comme exigence des marchés publics.

Le changement qui rend tout cela résoluble

Il y a deux ans, dire à une entreprise régulée « utilisez des modèles open source sur votre propre infrastructure » était un mauvais conseil. Les modèles ouverts étaient deux générations derrière les fermés, et les exploiter exigeait une équipe MLOps que la plupart des organisations n'ont pas. Ce conseil a mal vieilli.

Les modèles open source compétitifs de 2026 — Qwen 3.6, Gemma 4, GLM 5.1, la famille Nemotron de NVIDIA, DeepSeek V3.5 — ont atteint la parité avec les fermés sur de nombreuses tâches qui comptent en entreprise : raisonnement, programmation, analyse multilingue, vision-langage. Pas sur toutes : sur certaines frontières (agents complexes, raisonnement très profond) les fermés gardent l'avantage. Mais sur 80 % du travail quotidien d'une organisation, l'utilisateur final ne perçoit plus la différence.

Ce qui reste coûteux, c'est de les exploiter. Maintenir une version à jour de chaque modèle, le servir avec une faible latence, chiffrer les données de bout en bout et démontrer tout cela à un auditeur de l'ENS ne se fait pas en un week-end. C'est pour cela que nous avons construit OdiModel.

OdiModel : même expérience de chat, autre géographie de la donnée

OdiModel est notre assistant IA : une interface de chat standard, avec recherche web intégrée et voix bidirectionnelle native, qui donne accès aux meilleurs modèles open source à chaque moment. Au catalogue aujourd'hui : Gemma-4-E4B, Qwen 3.6 (y compris le 27B récemment ajouté), Qwen 3 / 3.5, Nemotron-VL-8B, Nemotron-30B et GLM-5.1-FP8. La liste est ouverte — si un client a besoin d'un modèle spécifique qui n'y figure pas, nous le déployons sous 24 heures dès lors qu'il respecte des conditions d'open source.

Ce qui change par rapport à un assistant commercial se trouve en dessous : chaque conversation est traitée sur un cluster NVIDIA HGX B200 dédié en datacenter espagnol, avec chiffrement AES-256 de bout en bout, isolement par compte au niveau de la session et du stockage, et aucune utilisation des conversations pour l'entraînement. RGPD natif, ENS, ISO 27001 — non comme un palier premium, mais comme la seule manière dont le produit existe.

Il existe un différenciateur supplémentaire pensé pour un public très précis : la voix. OdiModel synthétise la voix nativement en castillan, anglais, catalan, basque et galicien. C'est le seul assistant IA du marché à offrir une couverture complète des quatre langues officielles d'Espagne, ce qui en fait une réponse directe pour les administrations régionales, les services publics plurilingues, les médias régionaux et les entreprises ayant une activité réelle en Catalogne, au Pays basque ou en Galice. Pour ces clients, il n'existe aujourd'hui aucune alternative fonctionnelle comparable sur le marché.

“OdiModel n'est pas une alternative moins chère ou plus puissante que ChatGPT. C'est l'alternative qui garde les données chez vous.”

Positionnement produit

Quel outil dans quel cas

Il ne s'agit pas d'« arrêter d'utiliser ChatGPT ». Il s'agit de lire correctement quel outil convient à chaque cas. Si votre équipe marketing rédige des emails et des billets de blog avec des données non sensibles, ChatGPT ou Claude sont d'excellents outils, peu coûteux. Si votre service juridique verse des projets de contrats dans un chat, ou si votre équipe IT demande à un assistant d'analyser un dump de logs contenant des données personnelles, ou si votre administration sert un citoyen dans sa langue officielle, la conversation change.

OdiModel est aujourd'hui en bêta publique, ouverte sans engagement, gratuite pendant la bêta, sur odimodel.gpusolutions.ai. Si votre organisation appartient à l'un des secteurs ci-dessus et que vous souhaitez comparer la performance des modèles ouverts sur vos propres cas d'usage avant de parler de formules entreprise, c'est l'endroit.