BACUDA : aider les douanes à faire véritablement le pas vers l’analyse des données
25 février 2020
Par the WCO SecretariatLes membres de l’OMD ont demandé au Secrétariat de mettre l’accent sur l’élaboration d’orientations pratiques en matière d’analyse des données. À cet effet, un groupe d’experts a été créé dans le cadre d’un projet baptisé BACUDA. Quelques mots sur cette appellation : c’est l’acronyme de l’anglais « BAnd of CUstoms Data Analysts », que l’on peut traduire par « groupe d’analystes des données douanières ». C’est également un vocable qui signifie « changement » en coréen. De fait, le but du projet est d’aider les administrations douanières à s’approprier véritablement les outils et les méthodologies analytiques… ce qui représente pour beaucoup une entreprise de grande envergure.
Les membres de l’équipe BACUDA sont tous des experts des données avec lesquels le Secrétariat collabore depuis quelques années déjà. On y retrouve des douaniers chargés de la gestion des risques, des statistiques et des systèmes informatiques, ainsi que des économistes et des scientifiques des données ayant une formation universitaire en informatique. Les scientifiques des données de diverses nationalités travaillant au sein de l’Institut de science fondamentale (Institute for Basic Science ou IBS), de l’Institut supérieur coréen de science et de technologie (KAIST) et de l’Université nationale Cheng Kung (NCKU) sont particulièrement impliqués dans le projet et dirigent les travaux de mise au point d’algorithmes avancés. Cela dit, tout expert des données qualifié travaillant dans une administration des douanes ou dans le milieu universitaire peut rejoindre l’équipe BACUDA.
Objectif
BACUDA est donc un projet de recherche collaborative réunissant des experts douaniers et des scientifiques des données. Leur tâche est de mettre au point des méthodologies d’analyse des données, notamment des algorithmes, c’est-à-dire une suite d’opérations ou d’instructions qui permettent de résoudre un problème ou d’obtenir un résultat, dans des langages de programmation de source ouverte, tels que R1 ou Python2. Les méthodes et les algorithmes sont expliqués et partagés sur le site Web de l’OMD afin que les Membres de l’OMD puissent les appliquer sur leurs propres données.
Méthodes de travail
Afin de développer les algorithmes, les analystes de BACUDA utilisent les données douanières au niveau le plus détaillé, c’est-à-dire au niveau de la transaction. De telles données sont recueillies auprès des administrations des douanes qui souhaitent appuyer le projet. Elles sont ensuite anonymisées afin de respecter la confidentialité des informations soumises. Par ailleurs, les experts qui ont accès aux données anonymisées doivent signer une déclaration de confidentialité et les résultats préliminaires de toute recherche sont d’abord envoyés aux propriétaires des données, qui doivent marquer leur accord avant leur publication.
Si le succès du projet vient du fait que les experts de BACUDA ont accès à une quantité importante de données au niveau de la transaction, ces derniers travaillent également avec des données de sources ouvertes. Ces données ne se limitent pas à des éléments macroéconomiques ou géographiques et spatiaux recueillis auprès des organisations internationales. Elles incluent aussi des images satellites4 du domaine public publiées par certaines agences spatiales et militaires. En outre, les experts recourent également à certaines plateformes qui permettent de suivre le mouvement des moyens de transport, tels que les avions5, ou les activités délictueuses et incidents spécifiques6. Toutes ces données offrent la possibilité à l’usager de mieux comprendre les activités qui se déroulent aux frontières ainsi que les chaînes logistiques.
En outre, l’exploration de texte et les outils de web scraping permettent d’extraire des données non structurées des pages Web ou encore des sites de réseaux sociaux pour les analyser. Par exemple, des données sur les prix pratiqués par les plateformes de vente en ligne peuvent être indexées pour évaluer la conformité de la valeur déclarée d’un article à des fins d’évaluation en douane.
Résultats et voie à suivre
Afin de développer et de tester les algorithmes qu’ils ont mis au point, les analystes de BACUDA disposent de deux ordinateurs puissants liés à un serveur en nuage. Financée par le Service de la douane de Corée, cette infrastructure leur permet de travailler depuis n’importe quel endroit, à n’importe quel moment, pour autant qu’ils soient connectés à Internet.
L’équipe de projet a déjà élaboré des méthodes et des algorithmes de base qui sont présentés en « Series3 » et ventilés suivant les objectifs suivants : l’analyse en miroir avec R et Shiny, les prévisions en matière de recettes douanières, l’analyse des écarts en matière de recettes, le web scraping des données sur les prix, les algorithmes d’apprentissage automatique afin de détecter la fraude douanière. L’accès à ces informations est limité et les lecteurs intéressés. Les lecteurs intéressés, s’ils sont des fonctionnaires des douanes mais ne disposent pas d’un compte d’utilisateur sur le site web de l’OMD, sont invités à introduire une demande d’accès auprès de l’OMD via le formulaire en ligne. S’ils occupent une autre fonction dans le secteur public ou privé, ils sont invités à contacter l’Unité recherche de l’OMD.
En conclusion, il convient de souligner que l’équipe de projet est prête à résoudre toute sorte de casse-têtes au bénéfice des administrations des douanes et pas uniquement les problèmes relatifs à la lutte contre la fraude en soi. Elle pourrait, par exemple, apporter son concours à la mise au point de chatbots afin de conseiller les importateurs sur la manière de classer leurs marchandises ou sur la façon de calculer les droits et taxes s’appliquant à leurs transactions commerciales. Les experts de BACUDA pourraient également apporter leur aide concernant la mesure de la performance douanière, en appliquant des outils d’extraction de texte aux commentaires enregistrés sur les sites des réseaux sociaux plutôt que de recourir aux méthodes d’enquête traditionnelles.
En savoir +
http://www.wcoomd.org/en/topics/research/data-analytics.aspx (Attention, cette page n’est disponible qu’en anglais. Assurez-vous d’être connecté(e) afin de pouvoir accéder à la page)
WCO Research team
3 http://www.wcoomd.org/en/topics/research/data-analytics.aspx (Attention, cette page n’est disponible qu’en anglais. Assurez-vous d’être connecté(e) afin de pouvoir accéder à la page)
4 Voir https://eos.com/blog/7-top-free-satellite-imagery-sources-in-2019/
BACUDA est ouvert à tous les agents des administrations des douanes Membres de l’OMD ainsi qu’aux représentants d’autres secteurs, tels que les institutions universitaires. Les candidats désireux de se joindre à l’équipe devraient avoir une expérience avérée dans l’analyse des données et/ou être des analystes passionnés des données. Toute personne souhaitant rejoindre l’équipe ou ayant des suggestions à lui faire est invitée à contacter l’Unité de recherche de l’OMD.