Point de vue

Le « contrôle numérique » ou comment utiliser des données multidimensionnelles et des modèles de sélectivité fondés sur l’IA pour améliorer la lutte contre la fraude

Par David Smason, vice-président responsable du développement, division des solutions commerciales, Publican

Tirer parti de la révolution des données

La numérisation à l’échelle mondiale est en train de contribuer à une véritable explosion de la production de données, alimentant à son tour une demande croissante en données à tous les niveaux de la société. Ce phénomène est appelé la révolution des données.

Dans l’écosystème économique mondial, nous semblons nous approcher du sommet. Un nombre infini d’octets virevoltent dans un tourbillon interminable de données saisies et de résultats générés par des milliards d’entités publiques et privées.

Pour les administrations des douanes, la révolution des données présente autant de défis que de possibilités inégalées. Pour tirer pleinement profit des avantages offerts par cette nouvelle donne, elles doivent exploiter les écosystèmes de données multidimensionnelles qui permettent une modélisation de la fraude en tirant partie de l’intelligence artificielle (IA). Elles seront ainsi à même de mettre pleinement à contribution le pouvoir de ce que l’on appelle le « digital vetting » ou contrôle numérique. Tous ces termes sont expliqués ci-après.

Le paradoxe de la sélectivité

Améliorer la sélectivité est une problématique centrale de la lutte contre la fraude qui devrait, à ce titre, bénéficier des mêmes efforts en termes de modernisation et d’innovation que ceux accordés aux autres éléments du contrôle douanier. Toutefois, dans la pratique, la sélectivité en est encore à l’âge de pierre.

Analysons la question dans le détail.

Dans une situation optimale, l’analyse prédictive se fonde sur des outils de modélisation mathématique pour comprendre l’avenir, en répondant à la question : « que peut-il arriver ? ». Or, la capacité à formuler des prévisions et à détecter la fraude de manière plus précise dépend de la qualité et de la quantité des données utilisées. Si le volume de données de qualité est insuffisant, les modèles deviennent biaisés.

Ce paradoxe se traduit de la manière suivante :

  1. Les modèles d’analyse prédictive actuellement utilisés pour sous-tendre la sélectivité sont avant tout créés à partir de données autonomes unidimensionnelles, qui limitent les critères de sélectivité à des informations de référence couvrant un seul événement mesurable.
  2. Ainsi, la modélisation se fonde principalement sur des données partielles (données transactionnelles nationales et historiques).
  3. Cette situation crée un « biais des données » qui se produit lorsque les modèles analytiques sont « statiques » : les données de base changent et s’adaptent avec le temps mais les modèles ne tiennent pas compte des changements pertinents dans les données.

Les modèles biaisés portent toujours préjudice aux administrations douanières car ils débouchent soit sur un nombre trop élevé de résultats faussement positifs, soit sur une détection minime de la fraude.

Il est important de signaler que, suite à la signature d’accords de partage des données passés entre services gouvernementaux ou avec le secteur privé, certaines administrations ont accès à des données concernant des transactions ou des saisies à l’étranger. Toutefois, ces données sont plutôt exceptionnelles et leur nombre ne suffit pas à faire pencher la balance dans un sens ou dans un autre.

Exemples

L’exemple ci-dessous porte sur l’analyse d’une transaction d’importation basée sur des données unidimensionnelles.

Transaction : L’envoi X, d’une valeur V et d’un poids N, est envoyé par l’expéditeur Z à l’importateur Y.

Modèle d’évaluation :

  1. La valeur, le poids et le type d’envoi cadrent-ils avec les transactions passées entre les parties ?
  2. Les parties entretiennent-elles une relation commerciale de longue date ?
  3. L’importateur est-il une société de bonne réputation ?

L’adoption de techniques analytiques unidimensionnelles telles que celles-ci limite fortement la capacité des administrations des douanes à adapter les règles de sélectivité face aux changements intervenant sur le marché, dans la règlementation, le commerce ou encore les conditions des entreprises.

Effet négatif

Publican Trade Solutions a mené plusieurs enquêtes auprès de dizaines d’administrations douanières. 94 % des répondants disent rencontrer d’énormes difficultés à arriver à des modèles analytiques prédictifs stables aux fins de la détection de la fraude. Par ailleurs, 84 % indiquent que leur administration recourt exclusivement à des moteurs de risques basés sur des règles à des fins décisionnelles, ces règles étant en grande partie établies sur la base de suggestions ponctuelles, de changements spécifiques apportés à la règlementation ou de modèles historiques.

En moyenne, les administrations interrogées ont déclaré que 34 % de tous les envois font l’objet d’une vérification matérielle, avec un taux de contrôles positifs de 2,1 %.

Les règles statiques s’avèrent donc bel et bien inefficaces pour détecter la fraude dynamique ; elles font non seulement perdre un temps précieux mais sont aussi une des causes principales de la perte de recettes.

Analyse prédictive avec « contrôle numérique » (données multidimensionnelles et modélisation fondée sur l’IA)

Pour remédier à cette situation, la douane aurait tout intérêt à utiliser des données dynamiques tirant parti de l’intelligence artificielle pour modéliser tous les cas de figure possibles. De tels modèles sont bâtis autour de l’idée que chaque transaction est différente et ne peut être évaluée en fonction des tendances passées. Les scénarios tiennent compte des modèles existants, fondés sur les données historiques et nationales, mais aussi des modèles élaborés rapidement sur la base de données actualisées afin de refléter les conditions actuelles de marché, la règlementation et la situation du commerce en temps réel. En ce sens, ils sont « multidimensionnels » et « prédictifs ».

L’exemple ci-dessous porte sur l’analyse d’une transaction d’importation basée sur des données multidimensionnelles.

Transaction : L’envoi X, d’une valeur V et d’un poids N, est envoyé par l’expéditeur Z à l’importateur Y.

Modèle d’évaluation :

  1. La valeur correspond-elle aux transactions passées et aux conditions réelles du marché ?
  2. Le poids est-il cohérent par rapport aux transactions passées et aux spécifications annoncées par le fabricant ?
  3. L’envoi cadre-t-il globalement avec le champ d’activité de l’expéditeur, son secteur d’activité et le prix du produit annoncé ?
  4. L’expéditeur possède-t-il des antécédents en matière de saisies ou de comportement frauduleux ?
  5. Existe-t-il une relation de propriété entre les parties ?

Un tel modèle met à contribution des jeux de données interdépendants multiples qui tiennent également compte des données en temps réel et des conditions actuelles.

Cette méthodologie, qui est le résultat direct de la numérisation à l’échelle mondiale, est appelée « digital vetting » ou « contrôle numérique », car les modèles d’évaluation exploitent toutes les données disponibles à n’importe quel moment pour contrôler les envois aux fins de la détection de la fraude.

Les technologies du secteur privé pour le contrôle numérique

Le fait est qu’il demeure difficile d’introduire dans un système analytique des données pluridisciplinaires, non structurées, variées et hautement instables, puisées dans des sources éparses et diverses. Une solution envisageable serait d’utiliser les technologies, les plateformes et les services des organisations du secteur privé qui se spécialisent dans la mise au point et le déploiement de modèles d’IA pour créer des indicateurs d’écart et pour détecter les mécanismes révélateurs de fraude.

Ces types de modèles sont élaborés à partir de données mondiales extraites de jeux de données sur le commerce et l’économie, de sources ouvertes et payantes. Une fois que les données ont été collectées et analysées, la modélisation informatique basée sur l’IA est utilisée pour mettre au point et appliquer des jeux de données pertinents afin de déterminer les mécanismes et schémas en matière de fraude. Les données concernant les relations entre les opérateurs commerciaux et leurs structures ainsi que le prix et la valeur des marchandises revêtent une importance particulière pour la douane.

Étant donné qu’elles changent avec le temps et selon l’endroit, les données doivent constamment être analysées pour déterminer les écarts et autres variations, et  les indicateurs de fraude ajustés en conséquence. De plus, des scénarios doivent être constamment extrapolés à partir des données existantes, en fonction des variations et des tendances constatées grâce aux informations dynamiques qui sont saisies dans le système et qui proviennent d’une multitude de sources à la fois mondiales et localisées.

Le système analytique qui est ainsi créé peut aussi absorber des données sur les entités nationales et sur les transactions passées. Une fois que ces données sont introduites dans le modèle d’IA, les éléments suivants peuvent être générés :

  • des indicateurs de référence couvrant les caractéristiques formelles des entités (nom de la société, structure, lieu, champ d’activité, valeur des marchandises, etc.).
  • des schémas uniques indiquant les liens formels existant entre les entités (types d’échanges commerciaux, structures de propriété se recoupant, sites de production, etc.).
  • des indicateurs de fraude qui permettent de relever les comportements frauduleux avérés d’une société (antécédents en matière de saisies, comportement commercial proscrit, décisions judiciaires, etc.).

Les modèles peuvent être rapidement « formés » afin d’apprendre à identifier les vecteurs de menace qui sont spécifiques à une région ou un pays particuliers. Ce processus couvre les marchandises soumises à des restrictions et à des interdictions ainsi que des paramètres de sélectivité spécifiques aux tarifs. Des informations nationales concernant les modèles d’établissement de prix de référence et de valeurs devraient également être incorporées. Par exemple, les modèles de dépréciation spécifiques nationaux pour les véhicules automobiles d’occasion, ou autres produits très spécifiques, sont considérés comme des modèles analytiques.

Cas de figure rencontrés sur le terrain

L’exemple suivant porte sur le traitement d’un envoi de mobilier de bureau. Les principales actions analytiques comprennent :

  • le classement, à travers la recherche d’images et la mise en correspondance,
  • l’évaluation tarifaire connexe,
  • l’analyse de la valeur sur le marché, basée sur les milliers d’informations de référence recueillies et puisées dans les données historiques, commerciales et de sources ouvertes,
  • l’analyse du poids réel à partir d’une recherche automatique menée dans les catalogues des fabricants ou des distributeurs, dont les résultats sont corrélés avec les données transactionnelles passées.

Pour le traitement des envois de voitures d’occasion, il est important de pouvoir déterminer le modèle, la valeur et l’état réel du véhicule. Les principales actions analytiques doivent permettre d’établir la corrélation entre le numéro de châssis déclaré et l’image de la voiture, les documents fournis et le kilométrage déclaré. Une analyse numérique est également menée pour jauger les dommages éventuels ou les anomalies, l’établissement du prix et l’évaluation du véhicule et l’exactitude du document de mise en circulation déclaré.

Pour les produits courants tels que les appareils électroménagers qui donnent lieu à de nombreux cas de fraude et qui exigent de mobiliser énormément de ressources aux fins de leur contrôle, les principales actions numériques comprennent :

  • l’évaluation du champ d’activité de l’expéditeur et de l’importateur et des marchandises dont ils font commerce,
  • l’analyse de la structure et des antécédents des entreprises impliquées,
  • la vérification des infractions passées pertinentes au niveau mondial,
  • l’analyse des structures de propriété.

Coopérer pour construire des écosystèmes de données

Les outils analytiques qui mettent à contribution des données multidimensionnelles deviennent rapidement un composant irremplaçable des écosystèmes de données douaniers. Au fur et à mesure que de plus en plus de données seront collectées, les modèles d’IA pourront être affinés et les scénarios mis au point n’en devenir que plus précis et exacts.

Tandis que la révolution des données se poursuit, les administrations des douanes peuvent relever de nombreux défis en utilisant la technologie adéquate. Il est désormais possible de faciliter l’évaluation et la vérification des envois du commerce électronique transfrontalier, d’accélérer la mainlevée de produits essentiels, de mettre au point des structures d’audit plus souples, de vérifier l’attribution de l’origine et de traiter les demandes de statut d’OEA et de superviser les opérateurs agréés plus facilement.

Compte tenu de tous ces éléments, le terrain est donc fertile pour une coopération entre les secteurs public et privé. En mutualisant leurs capacités et leurs capitaux respectifs au niveau opérationnel, règlementaire et technologique, les secteurs public et privé peuvent créer un écosystème de données fiable et hautement performant.

En savoir +
david.smason@publican.global
www.publican.global