Studi Tributari Europei. Vol.14 (2024), I.13 – I.24
ISSN 2036-3583

L’appréhension de l’intelligence artificielle par la fiscalité française

Bruno TrescherUniversité de Strasbourg (France)
Professeur, Faculté de Droit de Sciences Politiques et de Gestion, Université de Strasbourg, IRCM - UR 3399

Publié: 2025-04-10

France’s approach to artificial intelligence by the French tax system

Résumé

The application of GTP4 Chat has opened up new and more intense possibilities for the application of artificial intelligence At the same time, the possibility of acquiring new and more information in a difficult balance between greater administrative efficiency and the necessary respect for the privacy of personal data The use of artificial intelligence procedures has become massive on the part of the Ministry of Finance, but the corresponding applications have been of a varied experimental nature. The consequences of this technological revolution on tax procedures and its necessary legal framework, both by the legislator and by the independent administrative authorities (in particular the CNIL) and the courts, have yet to materialise.

L’application du Chat GTP4 a ouvert des possibilités nouvelles et plus intenses pour l’application de l’intelligence artificielle Dans le même temps, la possibilité d’acquérir des informations nouvelles et plus nombreuses dans un équilibre difficile à trouver entre une plus grande efficacité administrative et le respect nécessaire de la vie privée des données personnelles L’utilisation de procédures d’intelligence artificielle est devenue massive de la part du ministère des finances, mais les applications correspondantes ont été de nature diversement expérimentale. Reste encore à matérialiser les conséquences de cette révolution technologique sur les procédures fiscales et son nécessaire encadrement juridique tant par le législateur que par les autorités administratives indépendantes (notamment la CNIL) et les juridictions.

Mots-clés: Economie numerique; Ministère economie et finances; gestion amendemants; contrôle fiscal; ciblage de la fraude; IA foncier innovant.

Le lancement de ChatGPT en novembre 2022 a été perçu par l’opinion publique comme une révolution numérique ouvrant une nouvelle ère. Pourtant les technologies d’intelligence artificielle (IA) ont été envisagées dès les années 1950 et ont connu un essor dans les années 2010 bien avant ChatGPT grâce au développement de la puissance de calcul des systèmes d’information et des nouvelles techniques d’apprentissage par la machine (machine learning). Selon l’OCDE, « un système d’intelligence artificielle est un système automatisé qui, pour des objectifs explicites ou implicites, déduit, à partir d’entrées reçues, comment générer des résultats en sortie tels que des prévisions, des contenus, des recommandations ou des décisions qui peuvent influer sur des environnements physiques ou virtuels. Différents systèmes d’IA présentent des degrés variables d’autonomvie et d’adaptabilité après déploiement ».1 Cette définition a été reprise à la lettre dans le projet de Convention-cadre du Conseil de l’Europe sur l’intelligence artificielle et les droits de l’homme, la démocratie et l’Etat de droit du 17 mai 2024. Ainsi, dans le rapport explicatif de la convention, il est mentionné que cette « définition reflète une compréhension large de ce que sont les systèmes d’intelligence artificielle, notamment par opposition à d’autres types de systèmes de logiciel plus simples, basés sur des règles définies uniquement par des personnes physiques pour exécuter automatiquement des opérations ». Mais il convient surtout d’observer que ce choix hautement symbolique de s’adosser à la définition adoptée par l’OCDE le 8 novembre 2023 est issu de la nécessité d’améliorer la coopération internationale sur le sujet de l’intelligence artificielle et traduit surtout une volonté d’aboutir à une gouvernance de l’intelligence artificielle au niveau mondial. Pareille ambition se retrouve dans le règlement de l’UE n° 2024/1689 du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle. Alors que pour la commission un système d’intelligence artificielle est un « logiciel qui est développé au moyen d’une ou plusieurs des techniques et approches énumérées et qui peut, pour un ensemble donné d’objectifs définis par l’homme, générer des résultats tels que des contenus, des prédictions, des recommandations ou des décisions influençant les environnements avec lesquels il interagit », les parlementaires européens (s’inspirant des travaux de l’OCDE et estimant que la notion de système d’IA devrait être étroitement alignée sur les travaux des organisations internationales œuvrant dans le domaine de l’IA) ont insisté avec succès pour que soit introduite la notion d’autonomie. Aussi l’article 3 du règlement adopté dispose que par système d’IA, on entend un « système automatisé qui est conçu pour fonctionner à différents niveaux d’autonomie et peut faire preuve d’une capacité d’adaptation après son déploiement, et qui, pour des objectifs explicites ou implicites, déduit, à partir des entrées qu’il reçoit, la manière de générer des sorties telles que des prédictions, du contenu, des recommandations ou des décisions qui peuvent influencer les environnements physiques ou virtuels ».

Ainsi définie au niveau mondial et européen, reste à voir comme les administrations nationales et notamment fiscales ont appréhendé l’impact de cette nouvelle technologie. Il convient dans un premier temps de mesurer comment les pouvoirs publics se sont s’adapté à la nouvelle économie numérique pour identifier les contribuables et opérations imposables (I). Dans un deuxième temps, méritent d’être mentionner les récentes expérimentations en matière de collecte et d’utilisation de certaines données accessibles sur le net alors même qu’elles concernent des assiettes de l’économie traditionnelle (II). Enfin, il convient d’analyser comment sont repensées les pratiques d’investigation et de contrôle fiscal par l’emploi de datamining et de l’intelligence artificielle (III).

1 L’adaptation du contrôle fiscal à la nouvelle économie numérique

Traditionnellement, l’administration fiscale dispose d’un droit de communication (articles L 81 et suivants du LPF) qui autorise ses agents à prendre connaissance et copie d’un certain nombre de documents auprès de contribuables mais aussi de tiers pour les utiliser à des fins d’assiette, de contrôle ou de recouvrement. Cette prérogative ancienne et particulièrement précieuse pour l’administration lorsqu’elle est exercée auprès de tiers (comme des banques, des compagnies d’assurance, des huissiers des notaires, les organismes de sécurité sociale ou d’autres administrations publiques) a été modernisée pour s’adapter à l’impact des nouvelles technologies et surtout aux développements de l’économie numérique et plus récemment de l’économie collaborative.

Dans ce cadre, la loi permet aux agents d’obtenir des informations relatives à des personnes non identifiées (LPF, art. L 81, al. 2). Il s’agit de solliciter les opérateurs de communication électronique et les fournisseurs d’accès (LPF, art. L 96 G), dans le but de déceler de graves infractions, toutes sanctionnées par une majoration de 80 % (activité occulte, trafic de biens illicites, défaut de déclaration d’avoirs à l’étranger, insuffisances constatées ou omissions dans les déclarations prenant la forme d’un abus de droit ou de manœuvres frauduleuses).

Dans son ancienne rédaction, les agents des impôts pouvaient sans autorisation préalable (dans le cadre du droit de communication) se faire communiquer, pour la recherche ou la constatation certaines infractions limitativement énumérées, certaines données détenues par les opérateurs de communications électroniques et les fournisseurs d’accès et d’hébergement Internet. Etaient concernées les données traitées et conservées relatives à l’identification du vendeur ou du prestataire, à la nature des biens ou des services vendus, à la date et au montant des ventes ou prestations effectuées… permettant de détecter ou prouver certaines fraudes, notamment internationales.

Le législateur a dû réformer ce dispositif pour se conformer dans un premier temps à la jurisprudence du Conseil constitutionnel au regard du droit au respect de la vie privée.2 En conséquence, l’article 15 de la loi n° 2018-898 du 23 octobre 2018 relative à la lutte contre la fraude a encadré ce dispositif de garanties spécifiques à savoir :

  • la limitation des finalités poursuivies à la recherche ou à la constatation des manquements les plus graves, tels les activités occultes, la détention de comptes à l’étranger non déclarés, les fausses factures, les montages destinés à induire en erreur l’administration fiscale ;

  • l’exigence d’une autorisation préalable du procureur de la République, délivrée sur demande motivée de l’administration ;

  • l’obligation de destruction des données recueillies dans un délai contraint car les informations communiquées à l’administration doivent être détruites au plus tard à l’issue d’un délai d’un an à compter de leur réception, à l’exception de celles utilisées dans le cadre d’une procédure de contrôle, qui devront être détruites à l’expiration de toutes les voies de recours.

Ces garanties étant toujours jugées insuffisantes suite aux jurisprudences de la CJUE3 et du Conseil d’État4 le législateur est à nouveau intervenu, en deux temps, pour limiter la mise en œuvre de ce droit de communication. Tout d’abord l’article 173 de la loi de finances pour 2021 a placé l’exercice du droit de communication auprès des opérateurs Internet sous l’autorisation d’un contrôleur des demandes de données de connexion qui délivre dorénavant une autorisation préalable en lieu et place du procureur de la République. Afin de garantir son impartialité, ce contrôleur est élu, en alternance, par le Conseil d’État et par la Cour de Cassation parmi leurs membres pour une durée de 4 ans non renouvelable. Son indépendance fait qu’il ne peut recevoir d’instruction de la DGFiP, ni d’aucune autre autorité. Ensuite l’article 145 de la loi de finances pour 2022 restreint encore davantage le champ du droit de communication de l’administration fiscale auprès des opérateurs de communications électroniques et des fournisseurs d’accès et d’hébergement Internet. Ce dernier est ainsi limité aux seules infractions les plus graves, à savoir celles qui sont généralement sanctionnées par une majoration de 80 %5 .

Si le droit au respect de la vie privée a conduit le législateur à restreindre l’efficacité de l’article L 96 G du LPF en réduisant son domaine, cela ne préjudicie pas fondamentalement à l’administration fiscale puisqu’elle accède désormais largement aux informations souhaitées avec les nouveaux articles 1649 ter A et suivants du CGI, créant une obligation déclarative pour les entreprises opératrices de plateforme, qui mettent en relation à distance, par voie électronique, des personnes en vue de la vente de biens, d’un partage de biens ou de la fourniture d’un service.

En effet, à l’occasion de plusieurs rapports parlementaires,6 avait été mise en évidence l’inadaptation du système fiscal face au développement de l’économie collaborative. Si les revenus procurés par l’intermédiaire de ces plateformes sont en théorie imposables dans les conditions de droit commun, très peu sont réellement déclarés, d’où une perte significative de rentrées fiscales mais également une concurrence déloyale pour les opérateurs économiques classiques. Afin de remédier à cette situation, le législateur est intervenu à de multiples reprises pour renforcer les obligations déclaratives à la charge de ces opérateurs de plateformes numériques.

  • Dans un premier temps, la loi n° 2015-1785 du 29 décembre 2015 de finances pour 2016 a instauré, à la charge des plateformes en ligne, non seulement un devoir d’information des utilisateurs quant à leurs obligations fiscales et sociales à l’occasion de chaque transaction mais aussi la transmission d’un « relevé utilisateur » qui récapitule les sommes brutes perçues par leur intermédiaire et le nombre de transactions réalisées pendant l’année.7

  • Ne permettant pas une véritable « inquisition fiscale », ce dispositif initial a été complété par une obligation de déclaration automatique à l’administration fiscale des revenus des utilisateurs des plateformes (loi n° 2016-1918 du 29 décembre 2016 de finances rectificative pour 2016, et loi n° 2018-898 du 23 octobre 2018 relative à la lutte contre la fraude). Dans ce cadre, les entreprises opératrices de plateforme, qui mettent en relation à distance, par voie électronique, des personnes en vue de la vente de biens, d’un partage de bien ou de la fourniture d’un service en France, doivent transmettre à l’administration fiscale les mêmes informations qu’elles fournissent à leurs utilisateurs, à savoir l’identification de l’opérateur de la plateforme, l’identification de l’utilisateur, le statut de particulier ou professionnel, le nombre de transactions réalisées, le compte bancaire de l’utilisateur et bien évidemment le montant total brut des transactions réalisées sur un an. Cette déclaration qui doit permettre l’identification des vendeurs ou prestataires et des détenteurs de comptes est souscrite par voie électronique auprès de l’administration fiscale, au plus tard le 31 janvier de l’année qui suit celle de la réalisation des opérations. Par exception, ne sont pas soumises à déclaration les opérations réalisées par des personnes ayant effectué, au cours de la période de déclaration, moins de 20 opérations de vente de biens pour un montant total de moins de 3 000 €.

  • Consécutivement à l’adoption de la directive « DAC 7 » du 22 mars 2021, la loi n° 2021-1900 du 30 décembre 2021, portant loi de finances pour 2022, a complètement modifié le dispositif au sein des nouveaux articles 1649 ter A et suivants du CGI, en instaurant une obligation déclarative harmonisée. Entré en vigueur en 2023 (pour une première déclaration adressée au plus tard le 31 janvier 2024), le nouveau dispositif se veut plus efficace car il concerne davantage d’opérateurs de plateforme et s’insère dans une logique internationale d’échanges d’informations. Doivent dorénavant souscrire à cette obligation déclarative, tous les opérateurs de plateforme résidents de France ou ceux « constitués conformément à la législation française » ainsi que ceux possédant un établissement stable en France ou y ayant implanté un siège de direction. Mais sont surtout visés les opérateurs non-résidents, lorsqu’ils « facilitent des opérations à déclarer » et qu’ils n’ont pas souscrit une déclaration fiscale similaire auprès de leur propre administration fiscale, lorsqu’ils sont situés dans un autre État membre ou dans un État ayant conclu avec la France une convention permettant un échange automatique d’informations concernant les opérations réalisées par des vendeurs ou prestataires par l’intermédiaire de plateformes numériques. Si les opérateurs soumis à cette obligation sont plus nombreux, cette dernière concerne en revanche moins d’opérations. Certes, elle cible toujours les prestations de services par des personnes physiques, les ventes de biens, les locations de modes de transport ou de biens immobiliers de toute nature ; mais ne sont plus concernées les opérations de location relatives à d’autres biens meubles. De même ne sont pas soumises à déclaration les opérations réalisées par des personnes ayant effectué, au cours de la période de déclaration, moins de 30 opérations de vente de biens pour un montant total de moins de 2 000 €.

  • L’efficacité du dispositif est garantie par l’existence d’un panel de sanctions contre les opérateurs de plateforme défaillants. Ainsi, selon l’article 1736 XI du CGI, le non-respect de leurs obligations par les opérateurs de plateforme est passible d’une amende forfaitaire faisant l’objet d’une modulation selon la nature de l’infraction commise qui, en tout état de cause, ne peut excéder 50 000 €. Parallèlement, le législateur a prévu la possibilité d’inscrire les opérateurs de plateforme récidivant dans la méconnaissance de leurs obligations déclaratives sur une « liste noire » des opérateurs de plateforme non coopératifs (CGI art. 1740 D) dont la publication est subordonnée à l’accord de la commission des infractions fiscales. Concernant enfin les opérateurs de plateforme situés hors de l’Union européenne, l’article 1740 E prévoit des sanctions spécifiques puisqu’ils peuvent se voir retirer leur numéro d’enregistrement individuel à l’expiration d’un délai de trois mois qui suit deux mises en demeure (respectivement de 3 mois et 30 jours) de se conformer à leurs obligations déclaratives.

2 L’exploitation des données publiques mises en ligne pour des impositions étrangères à l’économie numérique

Si l’économie numérique a nécessité l’adaptation des obligations déclaratives et autres moyens de recherches d’information à la disposition de l’administration fiscale, celle-ci profite de ces mêmes nouvelles technologies et nouveaux usages pour se doter de moyens de contrôle pour des impositions dont l’assiette n’est nullement liée au numérique.

En effet, afin de faciliter l’identification de comportements frauduleux, l’article 154 de la loi n° 2019-1479 du 28 décembre 2019 de finances pour 2020 complété par le décret n° 2021-148 du 11 février 2021 pris après avis de la CNIL (Délib. n° 2020-124 du 10 févr. 2020) a autorisé l’administration fiscale, à titre expérimental et pour une durée de trois ans, à collecter et exploiter les contenus, librement accessibles, publiés sur Internet par les utilisateurs des opérateurs de plateforme en ligne.

Potentiellement attentatoire à la vie privée et à la liberté d’expression en ligne, cette collecte massive et automatique de données personnelles sur des sites internet et réseaux sociaux, a d’abord fait l’objet de l’exigence de garanties posées par la Commission nationale de l’informatique et des libertés (CNIL)8 puis d’une censure très partielle par le Conseil constitutionnel9 afin d’en fixer un cadre précis. En effet, s’il a validé dans l’ensemble le dispositif, le Conseil constitutionnel a toutefois estimé qu’il portait une atteinte disproportionnée au droit au respect de la vie privée et à la liberté d’expression et de communication en tant qu’il portait sur des défauts ou retards de production d’une déclaration fiscale dans les 30 jours suivant la réception d’une mise en demeure. Pour le juge constitutionnel, « dans une telle situation, l’administration, qui a mis en demeure le contribuable de produire sa déclaration, a déjà connaissance d’une infraction à la loi fiscale, sans avoir besoin de recourir au dispositif automatisé de collecte de données personnelles ».

Cet encadrement s’opère à trois niveaux :

  • Tout d’abord, l’administration fiscale ne peut utiliser que des « données ouvertes », c’est-à-dire celles qui sont délibérément divulguées et dont l’accès ne nécessite ni saisie d’un mot de passe ni inscription sur le site. Il est par ailleurs précisé que lorsque la personne est titulaire sur Internet d’une page personnelle permettant le dépôt de commentaires par des tiers, ces derniers ne peuvent faire l’objet d’aucune exploitation.

  • Ont également été précisées les conditions de conservation des informations recueillies : seules les données qui permettent de détecter des comportements frauduleux pourront être conservées pendant une durée maximale d’un an à des fins d’exploitation. Toutes les autres données, doivent être détruites dans un délai de 30 jours, voire de 5 jours pour les données sensibles : cela vise notamment l’état de santé, l’origine raciale ou ethnique, l’orientation sexuelle, etc…..

  • Enfin, les informations collectées ne peuvent servir qu’à détecter certaines infractions fiscales, à savoir les activités occultes, les manquements délibérés ou manœuvres frauduleuses visant à une domiciliation fictive ou artificielle à l’étranger, la contrebande et la vente de produits contrefaits ainsi que le blanchiment douanier. Par ailleurs, les informations collectées dans ce cadre ne peuvent fonder à elles seules un redressement. Transmises aux agents des services chargés du contrôle territorialement compétent pour corroboration et enrichissement, ces données permettent seulement d’établir qu’il existe des indices qu’une personne a pu commettre une des infractions visées.

En raison du succès de cette expérimentation, la loi de finances pour 2024 a non seulement prorogé ces dispositions jusqu’au 31 décembre 2025, mais en a surtout élargi le champ d’application. Si le dispositif initial était restreint à la seule collecte et exploitation des contenus librement accessibles sur les sites internet et manifestement rendus publics par leurs utilisateurs, le texte actuel autorise la collecte de données même lorsque l’accès à ces plateformes requiert l’inscription à un compte : en pratique, les agents des administrations fiscale et douanière pourront ainsi créer un compte sur le site internet d’une plateforme en ligne afin d’accéder aux contenus rendus publics par les contribuables.10 De plus, concernant les infractions fiscales, sont dorénavant également visés les manquements délibérés ou manœuvres frauduleuses qui ont conduit à une minoration ou d’une dissimulation de recettes. En contrepartie de ce renforcement du dispositif de collecte « la loi de finances pour 2024 prévoit l’obligation pour l’administration fiscale et l’administration des douanes de transmettre à la CNIL la liste des opérations de collecte engagées. Par ailleurs, «ces administrations devront également mettre à la disposition du public, pendant toute la durée de l’expérimentation, une information facilement accessible en ligne sur les finalités et les modalités de fonctionnement des traitements autorisés11 ». Comme l’observe le Professeur DUSSART, si les procédures de contrôle fiscal sont très strictement encadrées par un ensemble de garanties offertes aux contribuables, « l’utilisation des technologies de datamining ou issues de l’intelligence artificielle ne remet pas en cause les garanties traditionnelles du contribuable ».12

Parallèlement à cette montée en puissance du « web scraping », la loi de finances pour 2024 ouvre une possibilité pour les agents des impôts de procéder à des enquêtes sous pseudonyme sur des sites Internet, des réseaux sociaux et des applications de messagerie. Outre que les agents ont la possibilité de prendre connaissance d’informations publiquement accessibles sur internet même si cela nécessite la création d’un compte utilisateur, la principale nouveauté est de profiter de ce pseudonymat en échangeant avec les contribuables soupçonnés des manquements. Dans ce cadre, les agents ont la faculté d’extraire et conserver les données et preuves obtenues lors des échanges avec les personnes soupçonnées.

Dans la mesure où le conseil constitutionnel ne s’est pas prononcé sur ce pouvoir d’extraction et de conservation des données, des doutes peuvent être exprimés sur sa constitutionnalité : toutefois, le législateur a assorti le dispositif de garanties.

  • Tout d’abord, le nouvel article L10-0 AD du Livre des procédures fiscales prévoit que seuls des agents des finances publiques ayant au moins le grade de contrôleur des finances publiques (et sous condition de bénéficier d’une habilitation spéciale) peuvent réaliser ce type d’enquête. Si le texte garantit aux agents qu’ils ne sont pas pénalement responsables de leurs actes, il précise toutefois que ces agents ne doivent pas inciter les contribuables à commettre un manquement : à défaut les actes sont frappés de nullité.

  • Mais il apparaît surtout que ce nouveau droit d’enquête a un champ d’application réduit ; il n’est applicable que pour rechercher ou constater une activité occulte, un manquement délibéré, abus de droit ou manœuvres frauduleuses, une absence de déclaration de compte bancaire étrangers…, une présomption de revenus non déclarés provenant de certaines activités illégales.

Si les garanties posées par le législateur sont donc nombreuses, certains commentateurs regrettent que le texte est « silencieux sur la possibilité pour les agents d’opérer des traitements sur les données collectées ».13 La question est d’autant plus pertinente que ce traitement des données pourrait s’avérer automatisé avec le développement des nouvelles IA à la disposition de l’administration fiscale.

3 Le développement massif du recours l’IA par le ministère de l’économie et des finances14

Selon la Cour des comptes, les directions et services du ministère de l’économie et des finances étudient, développent ou exploitent pas moins 35 systèmes d’intelligence artificielle en 2023, dont treize sont déjà déployés et exploités, huit en cours de développement et 14 envisagés ou faisant l’objet d’une étude de faisabilité.15 Ces technologies sont classées du point de vue technique en trois catégories par la Cour des comptes :

  • « Le traitement naturel du langage, qui permet la création d’IA génératives capables de créer et d’analyser des textes, des images ou des sons…;

  • La classification et la prédiction par clustering ou par régression, qui permet d’entraîner des IA à détecter des anomalies ou des dossiers à risque, de générer automatiquement des échantillons de dossiers représentatifs d’un ensemble, ou encore de contribuer à la génération automatique de réponses en sélectionnant les données adaptées à la demande ;

  • L’analyse d’images par réseaux de neurones : ces réseaux sont composés d’au moins trois couches de neurones : une couche d’entrée qui reçoit des données brutes, reliée à une couche cachée qui traite ces données, elle-même reliée à une couche de sortie qui produit le résultat ».

Ces nouvelles technologies sont principalement destinées à la détection des fraudes, puisque 16 systèmes d’IA sur 35, soit 46 % du total y sont consacrées (2) : toutefois, il y a d’autres expérimentations qui intéressent plus ou moins directement la fiscalité qui méritent d’être mentionnées (1).

3.1 Les IA non destinées au contrôle

Le 23 avril 2024, le Premier ministre Gabriel Attal, présentait une famille de modèles d’intelligence artificielle générative dénommée « Albert », capable de produire du contenu de manière autonome destinée à accélérer les formalités administratives et apporter des réponses sûres, claires et efficaces aux utilisateurs des services publics.16 Si huit modèles « Albert » ont déjà été lancés, seulement deux sont actuellement utilisés au sein de l’administration dont une expérimentation par « France Services » qui fournit aux agents des 2750 guichets du réseau une réponse rédigée spécifique aux questions posées par les administrés. Indépendamment du déploiement de ce système intégré d’intelligence artificielle « Albert » qui dépasse le champ d’application des prélèvements obligatoires, deux expérimentations en prise directe avec la fiscalité méritent d’être présentées.

3.1.1 L’IA LLaMandements de gestion des amendements

La Direction générale des finances publiques (DGFiP) a initié projet LLaMandements qui repose sur un « grand modèle de langage » (abrégé en LLM) qui est un type d’IA pour la synthèse de travaux parlementaires. C’est un outil de suivi des amendements aux PLF, permettant leur analyse sémantique, le regroupement de familles d’amendements, l’identification des doublons et produisant un résumé. Son objectif est non seulement de permettre la compréhension et l’analyse de texte mais aussi d’en générer. Profitant notamment à la direction du budget et à la direction de la législation fiscale cette nouvelle IA a été utilisée pour la première fois lors de l’examen du projet de loi de finances pour 2024 : elle a permis à la direction de la législation fiscale des Impôts de synthétiser plusieurs milliers d’amendements déposés par les sénateurs et les députés. Ainsi, le système d’IA LLaMmendements décharge les agents de tâches consistant à classer et à résumer les amendements parlementaires. Pour arriver à ce résultat, l’administration fiscale s’est appuyée sur le modèle de langage de Meta (Facebook), déjà utilisé par la Direction interministérielle du numérique.

3.1.2 L’IA « Signaux faibles » de prédiction des défaillances d’entreprise

Après une phase d’expérimentation en Bourgogne-Franche-Comté, la Direction générale des entreprises (DGE), la Banque de France, la Délégation générale à l’emploi et à la formation professionnelle (DGEFP), l’Agence centrale des organismes de sécurité sociale (ACOSS), la Direction interministérielle du numérique et du système d’information et de communication de l’État (DINSIC) et la Direction générale des finances publiques (DGFiP) ont signé une convention de déploiement d’un outil de prédiction de défaillances d’entreprises dénommé « Signaux Faibles ».

C’est une « démarche partenariale » entre administrations qui permet d’identifier le plus en amont possible les entreprises fragiles afin de leur proposer les solutions d’accompagnement adaptées à leurs besoins. Le projet repose sur un algorithme, basé sur des mécanismes d’apprentissage, qui calcule le risque de défaillance à 18 mois des entreprises de plus de 10 salariés, en mobilisant et croisant l’ensemble des données détenues par les services de l’État, les organismes de sécurité sociale et la Banque de France. Sont ainsi croisées et analysées des données financières (ratios financiers, bilan et compte de résultats, etc…), des données sur l’emploi et des données sociales. Dans ce cadre ainsi protégé, les agents habilités peuvent d’une part, consulter les données relatives aux entreprises dont disposent les différents services de l’État et d’autre part, prioriser leurs instigations et, partant, cibler de manière optimale les prises de contact avec des entreprises fragiles identifiées par l’IA, tout en adaptant leur accompagnement.

Portant sur des données sensibles, le système d’IA « Signaux faibles » a été l’objet d’importantes garanties : ainsi la confidentialité des données est assurée car le système d’IA est hébergé sur une infrastructure ayant obtenu le label SecNumCloud délivré par l’ANSSI (Agence nationale de la sécurité des systèmes d’information). Ce label vise à attester de la « qualité et de la robustesse d’un service cloud » et comporte ainsi de réelles garanties en matière de confidentialité et de protection des données sensibles. Par ailleurs, pour inspirer la confiance tant des utilisateurs que des entreprises, le système « Signaux faibles » a nécessité un haut « niveau d’explicabilité » comme l’observe le rapport de la Cour des Comptes de 2024. Ainsi sa finalité est présentée sur une page publique et est précisée dans un guide d’utilisateurs mais surtout « le code du système d’IA est expliqué à tous les niveaux (du code source jusqu’au résultat métier) avec un travail spécifique de vulgarisation auprès des utilisateurs ».

3.2 Les IA destinées au contrôle

Dans son rapport d’activité pour l’année 2022, la Direction générale des Finances publiques a mis en avant les opportunités qu’offrent l’intelligence artificielle combinée avec le partage des données.17 Ainsi la part des contrôles ciblés par Intelligence artificielle et data mining est passée de 32,49 % en 2020 à 44,85 % en 2021 et 52, 36 % en 2022 (alors qu’en 2018, le chiffre n’était que de 13,85 %). Cette évolution s’explique par la multiplication des initiatives de la DGFIP pour exploiter tout le potentiel des nouvelles technologies. Ainsi, la DGFiP exploite ou développe des IA prédictives (notamment dans le cadre du programme Ciblage de la Fraude et Valorisation des Requêtes), des IA de reconnaissance d’images (à l’exemple déjà opérationnel de Foncier innovant), et des IA génératives.

3.2.1 Le « Ciblage de la fraude et valorisations des requêtes »

Consciente des potentialités de l’intelligence artificielle en matière de détection des fraudes, la DGFIP a lancé au début de la précédente décennie un programme de traitement des données nommé « Ciblage de la fraude et valorisations des requêtes » (CFVR). Initialement cantonné aux données professionnelles, puis étendu en 2015 aux données relatives à des personnes physiques ayant un lien avec une entreprise, le CFVR concerne depuis 2017 l’ensemble des particuliers.18 L’ambition de ce traitement automatisé de lutte contre la fraude est de modéliser les comportements frauduleux, en se basant notamment sur les caractéristiques des cas de fraudes avérées, ce qui doit permettre de « mener des actions de prévention, de recherche, de constatation ou de poursuite d’infractions pénales ainsi que des opérations de recherche, de constatation ou de poursuite de manquements fiscaux19 ». Il doit faciliter, par l’amélioration des capacités d’analyse de l’administration fiscale, une meilleure identification des situations potentiellement frauduleuses en mettant en évidence des incohérences ou des défaillances déclaratives dans les dossiers des contribuables.

Ce programme recourt à la méthode de « croisement de données en masse », ce qui permet l’identification de divergences entre les déclarations des redevables et la réalité : comme l’observe la CNIL (dans une Délibération n° 2020-123 du 10 décembre 2020), le traitement CFVR est basé sur des techniques d’exploration des données et permet la modélisation prédictive, l’analyse de risques, la recherche d’atypies ou d’incohérences et de liens entre différentes personnes ou entités professionnelles.20 Concrètement, l’algorithme croise des données, répertorie les « divergences par seuil d’enjeu » puis calcule dans un second temps un écart relatif en pourcentage entre la valeur déclarée et la valeur réelle ou estimée.

Outre une modélisation prédictive, la recherche d’atypies ou d’incohérences, la recherche de liens entre les différentes personnes ou avec des entités professionnelles, les fonctionnalités de ce traitement ont peu à peu été étendues afin de permettre l’envoi automatique de demandes de renseignements aux contribuables suite à un rapprochement des informations décelant des incohérences dans les déclarations fiscales. Toutefois la Cour des Comptes rappelle également que si le CFVR facilite la découverte d’une fraude, il ne « procède en aucun cas à la caractérisation d’une fraude fiscale mais constate simplement une anomalie ou une irrégularité possible21 ». Elle rappelle ce faisant la décision de la CNIL selon laquelle « les données modélisées par le traitement CFVR ne conduiront en aucun cas à une programmation automatique de contrôles fiscaux, ni a fortiori à des décisions directement opposables aux contribuables. Le traitement CFVR ne constitue donc qu’un outil d’aide et d’orientation des travaux des agents et non pas un outil de profilage destiné à identifier directement des fraudeurs potentiels22 ». Si la détection de la fraude est automatisée, sa répression sera toujours humaine : tout l’intérêt est cependant de diminuer le coût de cette intervention humaine. En effet, « le CFVR a permis de diminué les coûts de programmation du contrôle fiscal sans modifier le volume ou les objectifs de cette programmation … ainsi 50 % de la programmation concernant les professionnels et 30 % de la programmation concernant les particuliers reposent désormais sur une équipe de 32 personnes assistées par le data-mining, contre environ 500 personnes en 201823 ».

Parallèlement a été initié en 2018 un ambitieux projet PILAT (Pilotage et analyse du contrôle) qui a pour objectif la refonte complète du système d’information du contrôle fiscal. Partant du constat que les outils à la disposition des agents sont trop nombreux, hétérogènes et cloisonnés, ce projet doit aboutir à la mise en place de nouvelles applications et la réécriture d’outils existants jugés obsolètes. L’ambition affichée est d’aboutir non seulement à « une mutualisation des informations au sein des services de contrôle, mais également à un partage des données au fil de l’eau, depuis la programmation de l’opération jusqu’à son recouvrement effectif et, le cas échéant, la décision contentieuse ». Organisé sous formes de briques ou modules, le projet comporte l’entrée en service de nouvelles applications de manière échelonnée jusqu’à fin 2027. Dans ce cadre, a notamment été adopté un arrêté du 11 mars 2022,24 après avis de la CNIL,25 qui autorise la DGFIP à mettre en œuvre un traitement informatisé et automatisé de données à caractère personnel. Ce module du projet PILAT dénommé GALAXIE permet de visualiser, « au niveau national, d’une part, des liens existant entre des entités professionnelles (liens de participation), et entre des entités professionnelles et des personnes physiques (liens de dirigeant, d’associé ou d’actionnaire), et d’autre part, des éléments de contexte sur la situation patrimoniale et fiscale de ces personnes ».26 Ce nouvel outil s’insère dans une logique de complémentarité avec le traitement CFVR puisque les données traitées sont issues du traitement de ciblage de la fraude et valorisation des requêtes dans le cadre d’une alimentation mensuelle.

3.2.2 L’IA « Foncier innovant »

Un dernier exemple, plus sectorisé de l’usage des big data et de l’intelligence artificielle est le projet « Foncier innovant ». En complément du CFVR, la fiscalité directe locale a été l’occasion d’une expérimentation d’une des premières applications des méthodes de croisement de données ou d’apprentissage statistique puisque le projet « Foncier innovant » permet une valorisation des données issues des prises de vue aériennes de l’Institut national de l’information géographique et forestière (IGN). Ainsi les algorithmes permettent d’extraire des images aériennes publiques de l’IGN de meilleures délimitations des immeubles bâtis ainsi que l’existence de piscines. Un traitement informatique confronte ensuite ces données avec les déclarations des propriétaires effectuées auprès des services de l’urbanisme et de l’administration fiscale : les éventuelles divergences et anomalies sont ainsi mises en évidence ce qui permet à un agent de l’administration d’initier une opération de relance des propriétaires des biens non ou mal déclarés. D’abord testé dans 9 départements en 2022 (ce qui a permis la taxation de plus de 20 000 piscines au titre de la taxe foncière pour l’année 2022 pour un montant de 10 millions d’euros de recettes supplémentaires, le dispositif a été généralisé sur l’ensemble de la France en 2023 permettant d’identifier 122 533 propriétaires de piscines taxables en 2023 pour un gain annuel d’environ 43 millions d’euros (selon les derniers chiffres communiqués à la commission des finances du Sénat le 31 janvier 2024).27 Toutefois la Cour des Comptes relativise ce progrès au regard de la charge de travail supplémentaire pour les agents : cela est lié à l’augmentation du nombre de piscines imposées à la taxe foncière mais tient aussi aux limites de l’IA car Foncier Innovant génère encore de nombreux faux positifs qu’il revient aux agents d’exclure du processus.28

Outre ces deux systèmes d’IA déjà en activité, la DGFIP développe d’autres projets. C’est par exemple le cas du programme « Valorisation des cessions immobilières » (VCI) en cours de développement : il s’agit d’un outil de prédiction de la valeur vénale (prix du marché) d’un bien immobilier à usage d’habitation (maison ou appartement), permettant ainsi une comparaison avec le prix de vente déclaré. Un autre exemple susceptible d’être mentionné est la système d’IA dénommé « Econtact » qui est un outil de génération de textes destiné à permettre de répondre aux demandes des usagers sans intervention humaine. Ce « chatbot » est fondé sur les FAQ (foire aux questions) de la DGFiP aux usagers ainsi qu’un échantillon de questions/réponses réelles.29

La multiplication de ces initiatives de déploiement de systèmes d’intelligence artificielle démontre la prise de conscience de l’administration fiscale française et sa volonté d’adaptation. Reste encore à matérialiser les conséquences de cette révolution technologique sur les procédures fiscales et son nécessaire encadrement juridique tant par le législateur que par les autorités administratives indépendantes (notamment la CNIL) et les juridictions.


  1. OCDE, Recommandation du Conseil sur l’intelligence artificielle, OECD/LEGAL/0449↩︎

  2. Cons. const., 8 sept. 2017, n° 2017-752 DC et 2017-753 DC (Procédures n° 11, Novembre 2017, comm. 293 Commentaire Ludovic AYRAULT

    83. La communication des données de connexion est de nature à porter atteinte au droit au respect de la vie privée de la personne intéressée. Faute d’avoir assorti la procédure prévue par les dispositions en cause de garanties suffisantes, le législateur organique a porté une atteinte disproportionnée à ce droit.↩︎

  3. CJUE, gde ch., 6 oct. 2020, aff. C-245/19 et C-246/19, Luxembourg c/ B et a.. :; Dr. fisc. 2020, n° 42, act. 330↩︎

  4. CE, ass., 21 avr. 2021, n° 393099, 394922, 397844, 397851, 424717 et 424718, French Data Network et a. : JCP G 2021, 659 , note A. Iliopoulou-Penot↩︎

  5. Sont donc désormais exclues du droit de communication auprès des opérateurs de communications électroniques les infractions suivantes : insuffisances, omissions ou inexactitudes constatées dans les déclarations, sanctionnées par une majoration de 40 % en cas de manquement délibéré (CGI, art. 1729, a) ; infractions aux règles de facturation, dont la sanction vient par ailleurs d’être mise en conformité avec la Constitution (CGI, art. 1737, I ) ; transferts de sommes à l’étranger ou en provenance de l’étranger par l’intermédiaire de comptes non déclarés, de contrats d’assurance-vie non déclarés ou au moyen de transferts d’argent liquide effectués en méconnaissance des obligations de déclaration douanière, sanctionnés par une majoration de 40 % de l’imposition des revenus correspondants (CGI, art. 1758, al. 1) ; dépôt tardif de la déclaration annuelle relative à l’IFI lorsqu’il fait suite à la révélation d’avoirs à l’étranger, sanctionné par une majoration de 40 % (CGI, art. 1728, 5) ; manquements des administrateurs de trusts, passibles d’une amende de 20 000 € (CGI, art. 1736, IV bis) ; manquements des personnes physiques, associations et sociétés n’ayant pas la forme commerciale, domiciliées ou établies en France, concernant les références des comptes à l’étranger, passibles d’une amende de 1 500 € par compte non déclaré, ainsi que, sous les mêmes sanctions, concernant les avances remboursables ne portant pas intérêt qu’elles accordent (CGI, art. 1736, IV, 2) ; manquements des souscripteurs de contrats d’assurance vie d’organismes établis à l’étranger passibles d’une amende de 1 500 € par contrat non déclaré (CGI, art. 1766).↩︎

  6. Notamment Sénat, rapp. info n° 690, 17 sept. 2015 et Sénat, rapp. info n° 481 du 29 mars 2017↩︎

  7. Si la « DAC 7 » ne prévoit pas expressément d’obligation pour les plateformes d’informer les vendeurs ou prestataires de leurs éventuelles obligations declaratives, cette obligation instaurée par la loi de finances pour 2016 au sein de l’article 242 du CGI a été maintenue au fil des différentes réformes et transpositions.↩︎

  8. CNIL, Délibération n° 2019-114 du 12 sept. 2019↩︎

  9. Cons. const., Décision. n° 2019-796 DC du 27 déc. 2019↩︎

  10. Audrey Vivaldi, Prorogation et extension de l’expérimentation de la collecte par l’Administration des contenus librement accessibles sur les plateformes en ligne, Droit fiscal n° 3, 18 janvier 2024, comm. 147↩︎

  11. Ariane Périn-Dureau, Un an de fiscalité de l’incorporel, Communication Commerce électronique n° 2, Février 2024, 3↩︎

  12. Vincent Dussart, L’intelligence artificielle et le data mining au service du contrôle fiscal des entreprises, in L’entreprise et l’intelligence artificielle, Dir. Alexandra Mendoza-Caminade, Presses de l’Université Toulouse Capitole, 2023, p. 167↩︎

  13. En ce sens : Catherine Cassan et Paul Mispelon, Possibilité pour les agents de l’Administration de procéder à des enquêtes actives sous pseudonyme sur des sites internet, réseaux sociaux et applications de messagerie, Droit fiscal n° 3, 18 janvier 2024, comm. 148↩︎

  14. Alexandre Polak, Thibaut Huber et Arthur Nadot, « L’utilisation de l’intelligence artificielle par l’administration fiscale, Nvelles Fiscales, 2024, n°1366, p. 16»↩︎

  15. Cour des Comptes, « L’intelligence artificielle dans les politiques publiques : l’exemple du ministère de l’économie et des finances », Rapport S2024-1165 du 18 juillet 2024, p.14↩︎

  16. IA « souveraine » puisque développée par l’équipe DataLab de la Direction interministérielle du numérique (Dinum)↩︎

  17. Édouard Baffert : « Les big data au service de la lutte contre la fraude fiscale : l’EDEN tiendra-t-il ses promesses ? » Dr. fisc.2015, n° 23, com. 393 Mehdi Kimri et Pierre Legros, « Intelligence artificielle et finances publiques : Le régime juridique du contrôle fiscal algorithmique. De l’expérimentation à l’encadrement du recours aux dispositifs algorithmiques fiscaux » Dr. fisc. 2021,2021 n° 5, com. 122. Caroline Lequesne-Roth, « Intelligence artificielle et finances publiques : La lutte contre la fraude à l’ère digitale ; les enjeux du recours à l’intelligence artificielle par l’administration financière », Dr. fisc.2021 n° 5, com. 120↩︎

  18. En effet, par une délibération n° 2015-186 du 25 juin 2015 (JORF n°0225 du 29 septembre 2015), la CNIL avait émis des réserves sur un champ d’application trop large du CFVR en raison « du caractère innovant du dispositif et des risques qu’il est susceptible de faire peser sur la protection des données ». Elle considérait que le traitement CFVR devait être, dans un premier temps, limité à certains contribuables particuliers et ne pas viser indistinctement l’ensemble des personnes physiques. Au fur et à mesure des refontes de l’arrêté de 21 février 2014 et des retours d’expérience assortis de garanties supplémentaires, il y a non seulement eu pérennisation du traitement CFVR mais aussi extension aux fraudes relatives aux particuliers.↩︎

  19. Arrêté du 21 février 2014 portant création par la direction générale des finances publiques d’un traitement automatisé de lutte contre la fraude dénommé « ciblage de la fraude et valorisation des requêtes, JORF n°0055 du 6 mars 2014↩︎

  20. Délibération n° 2020-123 du 10 décembre 2020 portant avis sur un projet d’arrêté modifiant l’arrêté du 21 février 2014 portant création par la direction générale des finances publiques d’un traitement automatisé de lutte contre la fraude dénommé « ciblage de la fraude et valorisation des requêtes » (demande d’avis n° 1726052 v8), JORF n°0101 du 29 avril 2021↩︎

  21. Cour des comptes, Rapport d’études « La détection de la fraude fiscale des particuliers », 15 nov. 2023, p.36↩︎

  22. Délibération n° 2019-115 du 12 septembre 2019 portant avis sur un projet d’arrêté modifiant l’arrêté du 21 février 2014 portant création par la direction générale des finances publiques d’un traitement automatisé de lutte contre la fraude dénommé « ciblage de la fraude et valorisation des requêtes » (demande d’avis n° 1726052 v7), JORF, n° 0278 du 30 novembre 2019↩︎

  23. Cour des Comptes, « L’intelligence artificielle dans les politiques publiques : l’exemple du ministère de l’économie et des finances », Rapport S2024-1165 du 18 juillet 2024, p.34↩︎

  24. JORF n°0076 du 31 mars 2022↩︎

  25. Délibération n° 2022-025 du 17 février 2022 portant avis sur un projet d’arrêté portant création par la direction générale des finances publiques du traitement de données à caractère personnel dénommé GALAXIE (demande d’avis n° 2223022)↩︎

  26. Art. 2 de l’arrêté du 11 mars 2022 portant autorisation par la direction générale des finances publiques du traitement de données à caractère personnel dénommé GALAXIE

    Les données à caractère personnel traitées sont listées à l’article 3 de l’arrêté : pour les entreprises et personnes morales, il s’agit du numéro SIREN, de la dénomination, des dates de création et de cessation d’activité, du statut juridique, de l’activité exercée, des obligations fiscales, du régime d’imposition, de l’adresse fiscale de taxation et surtout des données relatives aux remboursements de crédit de TVA, des honoraires versés, des numéros, des indicateurs personnes sensibles, des données relatives au civisme fiscal, des données relatives au compte bancaire, des liens de dirigeants et d’associés…. Pour les personnes physiques, il s’agit des données relatives aux obligations fiscales, du revenu fiscal de référence, de l’année de déclaration de revenu, du numéro fiscal du foyer, de l’indicateur dossier à fort enjeu, des indicateurs personnes sensibles, des liens de dirigeants et d’associés…↩︎

  27. Sylvie Vermeillet et Didier Rambaud, Sénat, Rapport n°491 « IA, impôts, prestations sociales et lutte contre la fraude », 2 avril 2024 :↩︎

  28. Cour des Comptes, « L’intelligence artificielle dans les politiques publiques : l’exemple du ministère de l’économie et des finances », Rapport S2024-1165 du 18 juillet 2024, p. 40↩︎

  29. Ainsi, une cible de 65 % de taux de satisfaction des utilisateurs était fixé pour le Chatbot Econtact dans son contrat de transformation, mais le niveau de satisfaction était de 50% en 2023 (49 % en 2022).↩︎