Panorama

Dédouanement du fret express et des envois postaux : la Corée teste de nouveaux outils d’analyse pour éradiquer la fraude

Par Taeil Kang, directeur général du Service des douanes coréen

Les administrations douanières recueillent chaque jour un volume important de données. Par exemple, le Service des douanes coréen (Korea Customs Service – KCS) accumule chaque jour 45 Go de données structurées et 30 Go de données non structurées dans sa base de données. Cela étant, la plupart des administrations douanières étaient jusqu’à présent incapables d’exploiter ces données, faute de l’infrastructure informatique et des connaissances requises sur les techniques d’analyse.

Les choses ont changé, du moins en Corée, avec l’émergence d’une infrastructure informatique moderne et de solutions ouvertes d’analyse des mégadonnées qui permettent désormais de gérer et d’analyser ces données. Des outils tels que Hadoop et R, un langage et un environnement servant au calcul statistique par ordinateur et à la création de graphiques, permettent notamment de tirer des renseignements à partir des volumes énormes de données reçus chaque jour.

En 2017, le KCS a établi une feuille de route pour l’analyse des mégadonnées et a lancé un programme de formation de six mois pour veiller à l’épanouissement des talents et former des experts en analyse des données. Cette année, le Service a pu créer sa propre infrastructure dédiée à l’analyse des données. En outre, il prévoit de former 300 experts (soit 7 % du personnel douanier) en analyse des mégadonnées ces cinq prochaines années.

Cet article présente une expérience récente visant à déterminer si les nouveaux outils d’analyse pouvaient aider à vérifier le bien-fondé d’une hypothèse portant sur la fraude commerciale par le fret express et les envois postaux, et à repérer les transactions illicites potentielles.

Le défi

Du fait de la croissance exponentielle du commerce électronique, le nombre de petits colis que les douanes doivent dédouaner s’est envolé, mettant à rude épreuve les capacités des services de lutte contre la fraude. La Corée dispose d’un système d’exonération des droits et de procédures douanières simplifiées pour les marchandises de faible valeur, et des éléments donnent à penser que certains individus introduisent des marchandises en les répartissant en petites quantités dans des envois différents, afin de ne pas atteindre les seuils de minimis au-delà desquels les droits et/ou les taxes sont dus.

Jusqu’à présent, les méthodes conventionnelles n’ont pas permis à la Douane de lutter efficacement contre cette forme de criminalité en raison des difficultés que pose l’analyse des 200 millions d’éléments de données qui ont été produits rien qu’au cours des dix dernières années. On notera qu’en Corée, les prestataires de services de courrier express envoient les renseignements demandés aux fins du dédouanement par voie électronique, ce qui permet la formulation d’un avis préalable et, éventuellement, le dédouanement préalable des colis. L’opérateur postal coréen, Korea Post, envoie aussi certaines informations sur les colis par voie électronique.

Nuage de mots créé à partir de l’analyse des descriptions des marchandises achetées en ligne par un seul opérateur

 

Face à ce défi, le KCS a décidé de renforcer ses capacités d’analyse de données en réunissant les agents des douanes formés à l’exploration de données et les spécialistes des douanes chargés du dédouanement du fret express et des envois postaux. Partant des résultats de leurs discussions, des experts en informatique du secteur privé qui travaillent depuis des années avec les systèmes informatiques du KCS ont passé en revue les outils et méthodes d’analyse utilisés actuellement. Une équipe d’experts a ensuite durant deux mois testé certains outils d’analyse.

Hypothèse

À partir de leur expérience, les analystes du risque ont formulé l’hypothèse selon laquelle les opérateurs soucieux d’éviter les droits et taxes importent les marchandises en plusieurs petits colis, en utilisant un certain nombre d’adresses et de numéros de contacts différents. Autrement dit, les importateurs qui respectent les règles utilisent un nom, un numéro de téléphone et une adresse pour toutes leurs transactions, tandis que ceux qui ne les respectent pas utilisent une série complexe de noms, de numéros de téléphone et d’adresses.

Pour confirmer cette hypothèse, les registres des importations transportées par les services express et postaux sur une période de trois ans ont été extraits. Des outils de recherche ont ensuite été utilisés pour exploiter les données afin de trouver des informations spécifiques telles que les numéros de téléphone et les adresses. Ont enfin été créés, aux fins d’analyse, des ensembles de données contenant les données affinées, parmi lesquelles le nom, l’adresse et le numéro de téléphone du destinataire.

Résultats

Parmi les cas suspects que l’analyse a permis de mettre au jour figurait un importateur qui avait donné 123 numéros de téléphone différents et 127 adresses différentes. Pour faciliter la lecture des données, l’équipe chargée de l’analyse a converti les adresses en coordonnées géographiques. Plusieurs techniques de visualisation ont été utilisées. Par exemple, les ensembles de données ont été analysés au moyen d’ORA, un outil d’analyse réseau, dans le but d’examiner les corrélations et les liens. La figure 2 illustre le fait que 83 personnes différentes ont donné les sept mêmes numéros de téléphone à différentes occasions lors de l’importation de marchandises destinées à 60 adresses différentes.

L’analyse montre que des personnes différentes ont donné les mêmes numéros de téléphone à des occasions différentes

 

En entrant des informations telles que les numéros de téléphone, les descriptions des marchandises et le pays exportateur dans le programme de visualisation, les analystes sont parvenus à trouver les différentes adresses des importateurs. Les données sur sept importateurs suspects ont montré qu’ils utilisaient une région particulière de Séoul, capitale de la Corée, comme adresse, ce qui donne à penser qu’ils importaient peut-être des marchandises dans plusieurs petits colis vers de fausses adresses de destination partout dans cette région.

Représentation des différentes adresses utilisées par des importateurs suspects

Problèmes et solutions

Dans la première version du projet, l’équipe voulait analyser les données renseignées dans toutes les déclarations simplifiées et générales. Toutefois, dans bon nombre des déclarations, certaines informations sur l’expéditeur, le destinataire, la description des marchandises et le numéro de téléphone étaient absentes ou incomplètes. L’équipe a donc réduit la portée de l’analyse de façon à inclure uniquement les déclarations générales d’importation de marchandises qui contenaient des informations relativement complètes et exactes.

Même lorsque les données étaient complètes, il a fallu les affiner. Dans de nombreux cas, la même adresse était écrite de différentes façons ou avec des orthographes différentes. Le processus de nettoyage des données s’est révélé long et assez fastidieux. Il a impliqué de remplacer le code de pays par un nom de pays, et de supprimer les caractères spéciaux dans les numéros de téléphone internationaux et les espaces vides dans les adresses. Le processus de collecte et d’affinage des données est celui qui a pris le plus de temps et au cours duquel ont été rencontrées le plus de difficultés imprévues.

Enseignements tirés

La maxime « à données initiales douteuses, résultats douteux » exprime le fait que l’on a besoin de « bonnes » informations pour pouvoir effectuer une analyse de données qui ait du sens. Cette expression souligne que la qualité des résultats obtenus est fonction de celle des données initiales. L’expérience a appris au KCS que ses agents avaient tendance à négliger l’importance de la qualité des données. Fort de ce constat, le service prévoit d’effectuer un nettoyage automatique des données au moment de leur enregistrement dans sa base de données, grâce à des technologies d’intelligence artificielle.

Autre enseignement : l’importance de la connaissance du domaine. Au cours du projet, un spécialiste en informatique du secteur privé a dit qu’un « profane » aurait mis un mois pour accomplir une tâche qui avait pris une semaine aux fonctionnaires des douanes. Autrement dit, la connaissance du domaine est essentielle pour l’analyse des données. Dès lors, l’analyse des mégadonnées sur des thèmes liés aux douanes doit continuer de relever de la compétence de celles-ci.

Projets futurs

Cette expérience était un projet pilote de courte durée qui avait pour objet de voir comment l’analyse des données pouvait améliorer l’analyse des risques. Ce projet visait le fret express et les envois postaux en vue de repérer des cas de fraude commerciale, mais le KCS estime que l’on pourrait appliquer la même méthode à d’autres domaines. Par exemple, les malfaiteurs qui essaient d’importer des marchandises à haut risque, telles que des stupéfiants et des armes, ont tendance à renseigner une fausse adresse dans la déclaration d’importation afin de cacher leur identité.

Le KCS prévoit d’inviter un plus grand nombre d’experts en informatique afin d’améliorer les outils utilisés dans le cadre de ce projet et de les adapter aux besoins d’analyse du Service. Ces solutions seront intégrées dans le système du KCS et serviront à initier de vraies enquêtes.

En savoir
kcstcd@customs.go.kr

Seuils de minimis en Corée

La Corée utilise les seuils de minimis de différentes façons :

  • en tant que seuils de « valeur » en dessous desquels les droits et taxes ne sont pas prélevés et aucune déclaration douanière n’est requise. Pour les opérateurs postaux, ce seuil est de 150 dollars des États-Unis (prix FOB). Pour les prestataires de services express, il est de 150 dollars, ou de 200 dollars si les marchandises proviennent des États-Unis, conformément à l’accord de libre-échange signé entre la Corée et les États-Unis ;

 

  • en tant que seuils de « déclaration » concernant les marchandises pour lesquelles une déclaration douanière complète doit être faite. Pour le fret express, une procédure de « dédouanement sur liste » permet à l’opérateur de recevoir les marchandises dans ses locaux et, si leur valeur est inférieure au seuil de minimis, de les dédouaner en fournissant 24 éléments d’information, parmi lesquels le nom et l’adresse de l’opérateur, le nom et l’adresse du destinataire et le type et le prix des marchandises. Les marchandises qui entrent sur le territoire par le courrier postal international, elles, sont dédouanées sur place.