Focus

Commencez petit, pensez grand, pensez « Big Data »

14 février 2016
Par Ziv Baida, Directeur du développement commercial, secteur public européen, chez Dun & Bradstreet

93 % des personnes ayant répondu à une récente étude menée par Unisys Corporation auprès d’instances gouvernementales centrales ont déclaré que le recours à des outils d’analyse de données permettait d’améliorer la qualité et la rapidité des processus de prise de décision. Toutefois, 70 % d’entre eux se disaient préoccupés quant à la capacité de leurs services non pas tant à simplement recueillir les données clés qu’à les analyser. Une telle préoccupation s’explique entre autres par « l’explosion de l’information », expression qui décrit l’augmentation rapide du volume de données auxquelles nous avons désormais accès et qu’il s’agit par conséquent de gérer et d’interpréter.

Renoncer n’est pas une solution envisageable dans la mesure où ces données constituent, ou constitueront, un atout majeur pour l’ensemble des organismes publics. Si la complexité de la tâche ne doit pas être sous-estimée, elle ne doit pas non plus être surestimée : des solutions de gestion des données relativement simples à mettre en œuvre peuvent résoudre nombre des problèmes auxquels sont confrontés les services des douanes et de gestion des frontières. Tout projet de gestion des données ne doit pas forcément être un projet « Big Data ».

Définition des mots-clés

Pour comprendre de quoi il s’agit, il importe de définir la terminologie en commençant par opérer une distinction entre données et informations. Les données sont purement et simplement des faits. La numérisation et l’abondance des capteurs et des technologies « intelligentes » ont donné lieu à un foisonnement de données disponibles. Toutefois, quiconque souhaite obtenir des données est en réalité à la recherche d’un moyen et non d’une fin en soi.

Nous cherchons tous à prendre des décisions éclairées sur la base de connaissances obtenues à partir d’informations, c’est-à-dire de données qui ont été traitées, organisées, structurées ou contextualisées. L’analytique consiste à générer des connaissances à partir de données en recourant à l’analyse systématique de ces données par ordinateur. Le Big Data désigne le recours à une analytique complexe couvrant quatre dimensions baptisées par IBM les « quatre V du Big Data » :

  1. le Volume, qui désigne l’ampleur des données ;
  2. la Vélocité, qui renvoie à l’analyse en temps réel des flux de données, par exemple sur un marché boursier ou dans des véhicules équipés de capteurs ;
  3. la Variété, qui désigne l’analyse des différentes formes de données (données structurées et non structurées, texte, son, vidéo, données de capteurs, média sociaux, etc.) ;
  4. la Véracité, qui renvoie à la nécessité de gérer le problème inhérent au caractère incertain des données, à savoir le fait que l’on ne puisse avoir confiance en leur qualité, leur disponibilité, leur exhaustivité et leur exactitude.

Avantages des (méga)données pour les administrations douanières

Imaginez pouvoir…

  • prévoir quelles entreprises ne respecteront pas les réglementations ;
  • détecter les cas de fraude grâce à des systèmes de contrôle automatisés plutôt que par le biais d’inspections et d’audits longs et fastidieux ;
  • être informé pro-activement de toute situation particulière impliquant des opérateurs dotés du statut d’OEA ;
  • avoir une vue d’ensemble de tout ce que vous savez sur une entreprise au sein de votre service ;
  • échanger en continu avec d’autres services frontaliers des informations relatives aux opérateurs ;
  • identifier les réseaux internationaux de criminalité organisée agissant via vos installations portuaires.

Vous pensez qu’il s’agit de vœux pieux ? Sachez pourtant que relever ces défis peut être plus simple qu’il n’y paraît.

Où est le problème (ou pas) ?

Les pessimistes vous diront que vous devez d’abord disposer d’un programme de gestion des informations digne de ce nom (ce qui vous prendra sans doute 3 ans d’efforts) pour pouvoir commencer à travailler sur l’analytique des mégadonnées, dans la mesure où la qualité de cette analyse est directement proportionnelle à la qualité des données sous-jacentes. Or, même si la qualité des données est un élément essentiel, il ne faut pas forcément en déduire que passer par un tel programme constitue la seule solution envisageable. Une autre solution consiste à privilégier l’acquisition et l’utilisation de données de grande qualité, et non à avoir uniquement recours aux données qui sont à votre disposition (mais dont l’accessibilité est sujette à caution).

Certes, un programme complet de gestion des informations est nécessaire, il constituera d’ailleurs un investissement à long terme qui garantira la réactivité et l’efficacité de votre organisation. Toutefois, attendre l’achèvement d’un tel programme n’est plus de mise, puisque, de nos jours, les changements interviennent à un rythme de plus en plus rapide. En fait, il existe de nombreux avantages immédiats à agir dès à présent.

Quelle est la clé du succès ?

  • Identifier les problèmes spécifiques que vous souhaitez résoudre, par exemple le non-respect des règles de sécurité relatives à l’importation de feux d’artifice à l’occasion de fêtes spéciales ou la fraude carrousel à la TVA ;
  • identifier les données clés qui permettront de résoudre ces problèmes ;
  • acquérir ces données ; et
  • les intégrer dans votre système informatique.

Il est un écueil que les organisations ne parviennent pas toujours à éviter et qui consiste à utiliser uniquement les données déjà disponibles, soit parce que ces organisations n’ont pas connaissance de l’existence de données externes, soit parce qu’elles préfèrent tout garder en interne. Toutefois, disponibilité et qualité ne coïncident pas forcément. Si les données disponibles au sein de votre organisation ne vous permettent pas de résoudre vos problèmes, des données externes vous seront d’un grand secours.

Rôle des informations commerciales

Les douanes ayant pour principale mission de surveiller les flux de marchandises, il va de soi qu’elles disposent des meilleures informations possibles sur les activités propres aux sociétés impliquées dans les chaînes logistiques internationales. Des bases de données contenant des informations relatives aux entreprises dans le monde entier et quotidiennement mises à jour sont disponibles. Chaque entité (entreprise) répertoriée est dotée de son propre identifiant unique mondial qui permet aux douanes d’identifier sans aucune ambiguïté possible les opérateurs commerciaux.

Une fois identifié, ce numéro représente un véritable sésame permettant d’accéder aux précieuses informations que sont, notamment, les données les plus récentes sur la situation de la société concernée, sa carte d’identité (secteur d’activité, taille, statut juridique, situation financière), ses liens avec d’autres sociétés et sa cote en matière de risque. Les experts en analytique génèrent ces informations en comparant une entreprise avec ses pairs sur la base de données historiques.

Remédier aux insuffisances

Généralement, les administrations douanières connaissent les opérateurs locaux, bien qu’à des degrés divers, certains très bien, la plupart un peu. Elles en savent en revanche très peu sur les opérateurs étrangers. Les entreprises fournissant des données commerciales permettent de remédier à ces insuffisances. Elles connaissent les sociétés, suivent leurs activités depuis des années et sont donc à même de formuler un avis statistiquement valide sur leurs opérations, et ce, alors même qu’il s’agit parfois, aux yeux d’un service gouvernemental, d’un importateur/exportateur inconnu jusqu’alors.

Il arrive qu’une simple vérification auprès du fournisseur de données suffise à révéler des cas de fraude ou d’usurpation d’identité lorsque, par exemple, une société opère sous la dénomination commerciale d’une entreprise qui a fait faillite. Lorsqu’elle est intégrée dans les systèmes informatiques des services chargés du traitement des demandes de permis, de demandes de remboursement de TVA et de déclarations d’importation/exportation, une telle politique systématique de vérification peut engendrer des avantages substantiels. L’utilisation de données commerciales qualitatives contribue à la lutte contre la fraude en permettant d’établir qu’une société inconnue sera probablement conforme et en fournissant aux agents chargés du ciblage des signaux d’alerte.

Un autre domaine d’application est celui du guichet unique. Un numéro unique étant attribué à chaque entreprise, le recours à des données commerciales permet dans un environnement de guichet unique, où plusieurs services gouvernementaux disposent pour les entreprises de leurs propres identifiants, une meilleure gestion et contribue à la gestion coordonnée des frontières.

Court terme/long terme

Les données commerciales externes sont mises à disposition via des API (interfaces de programmation d’applications) et peuvent être facilement intégrées dans un système informatique automatisé, sans que cela ne réclame une modification sensible de l’environnement informatique. L’expérience montre que des avantages substantiels peuvent être générés : réduction des cas de fraude, augmentation du recouvrement des recettes, amélioration de la sécurité et meilleure utilisation de l’expertise d’agents dont le nombre est limité.

Ces solutions peuvent être appliquées assez rapidement et permettent de récolter des avantages à court terme, tout en donnant à une organisation le temps nécessaire, d’une part, au développement de compétences en matière d’analyse de données et, d’autre part, au déploiement d’un programme approfondi de gestion des informations. De l’investissement dans ces deux domaines dépendra la réussite à long terme d’un programme d’analyse des Big Data.

Un programme de gestion des informations vise à créer une infrastructure grâce à laquelle les données collectées au sein de l’organisation – y compris les données externes – seront disponibles partout au sein de l’organisation. La vision à long terme implique donc de facto de combiner données internes et données externes dans la mesure où la production de certaines connaissances exige que soient conjugués ces deux ensembles de données.

Les exemples d’application décrits ci-dessus (importateur/exportateur inconnu, usurpation d’identité…) nécessitent des données externes. S’agit-il pour autant de mégadonnées? Parfois oui, mais pas toujours. Dans certains cas, il suffit d’obtenir un nombre réduit de données, mais de qualité, et de les incorporer dans de simples règles opérationnelles et profils de risque déjà intégrés dans un système informatique.

Parfois, la situation exige un niveau plus élevé de compétences analytiques. L’analytique et le Big Data constituent des champs encore inexplorés pour un grand nombre de services gouvernementaux et, à l’instar d’autres domaines d’activité, ils supposent également l’acquisition de compétences spécifiques qui ne sont peut-être pas encore présentes au sein de votre organisation. Si vous ne disposez pas encore de ces compétences, vous pouvez avoir recours à des applications technologiques appelées « Insights as a Service », et ce jusqu’à ce que vous ayez développé en interne les compétences nécessaires.

Le recours aux techniques propres à l’analytique et aux mégadonnées est également synonyme de changement dans la manière dont fonctionne l’organisation : décider d’abandonner les contrôles fondés sur l’intuition pour adopter des contrôles fondés sur l’analyse du risque. Le développement des compétences requises et la mise en œuvre d’une stratégie de gestion du changement vont donc de pair. En outre, le déploiement d’une telle politique garantira la concrétisation de votre vision à long terme, c’est-à-dire voir les données devenir un atout maître de votre stratégie de lutte contre la fraude fondée sur l’information.

Enseignements ou comment réussir

  1. Commencez par définir un objectif clair, à cerner un problème opérationnel précis. Ayez une idée exacte de l’ampleur du problème identifié. Ne sautez pas le pas du Big Data parce que c’est à la mode.
  2. Ayez conscience de l’importance de l’enjeu : la prise en compte des données participe d’une véritable stratégie d’entreprise et n’est pas une question tactique ou opérationnelle. Il est donc essentiel de pouvoir compter sur l’implication et le soutien des cadres.
  3. Insistez sur la qualité des données. Les données disponibles pèchent parfois par un manque de qualité.
  4. Ayez conscience de cette réalité et cherchez des données à l’extérieur de votre organisation.
  5. Ne cherchez pas à réinventer la roue, d’autres personnes ont mis en œuvre ce que vous souhaitez accomplir.
  6. La notion de « big » est une notion relative. Ce qui est « small » pour un service donné peut s’avérer « big » pour le vôtre.

Et enfin, fixez-vous des objectifs réalistes : commencez petit mais pensez grand. Pensez Big Data !

 

En savoir +
BaidaZ@DNB.com

Dun & Bradstreet (D&B) est le leader mondial du secteur de l’information sur les entreprises, détenant la plus grande base de données des entreprises et gérant des millions de mises à jour quotidiennement. Chaque entité au sein de la base de données a son propre identifiant, le numéro DUNS®. 87 % des entreprises du Fortune 500 ont recours aux données de D&B afin d’obtenir des données et des renseignements cruciaux, ainsi que de nombreux organismes gouvernementaux.

L’auteur est directeur du développement commercial pour le secteur public européen. Au cours des dernières années, le Dr Ziv Baida a activement participé à l’élaboration de solutions informatiques utilisées par les douanes dans plusieurs pays et continents. Il a joué un rôle important dans le pilotage de concepts clés tels que les Secure Trade Lanes, le guichet unique et les opérateurs économiques agréés. Ziv Baida a également joué un rôle clé dans la conception du système de gestion des déclarations d’importation/exportation néerlandais. Au cours des dernières années, il s’est spécialisé sur le potentiel des nouvelles technologies pour la douane, et notamment sur le rôle des mégadonnées dans la gestion des risques douaniers, les technologies d’inspection mobiles et les solutions de collaboration interne et inter-institutions.