En 2022, la OMA y sus Miembros decidieron que la “Tecnología e Innovación” sería una de las tres áreas de enfoque del Plan Estratégico 2022-2025 de la OMA. En los últimos años, las aduanas chinas han aplicado el concepto de “aduanas inteligentes, fronteras inteligentes y conectividad inteligente”, con el que se estableció una hoja de ruta hacia las soluciones digitales e inteligentes para el control, la gobernanza y la cooperación en las aduanas. La aplicación del concepto llevó a las aduanas chinas a buscar formas de integrar los macrodatos y la inteligencia artificial (IA) en sus herramientas de analítica de datos.
Puede resultar útil que al principio de este artículo se expliquen términos clave como datos, información, conocimientos, analítica, macrodatos e IA. Las administraciones aduaneras tratan de tomar decisiones con seguridad, basándose en conocimientos que proceden de la información, es decir: datos procesados, organizados, estructurados o presentados en un contexto significativo. La analítica es la creación de conocimientos a partir de datos mediante el análisis computacional sistemático. Los macrodatos son conjuntos que contienen datos de mayor variedad (datos estructurados y no estructurados, texto, sonido, vídeo, mediciones de sensores, redes sociales, etc.), de gran veracidad, que llegan en volúmenes mayores y a cada vez más velocidad. El término IA se utiliza para describir sistemas entrenados para utilizar información a fin de realizar tareas, como identificar patrones o generar nuevos contenidos.
En 2018, se creó una División de gestión de macrodatos dentro del Departamento de gestión de riesgos de las aduanas chinas para coordinar la gestión de los datos aduaneros, establecer una arquitectura de datos unificada, formular planes, sistemas y esquemas, y aplicarlos. También se crearon equipos en los distritos aduaneros de Tianjin, Shanghái, Huangpu y Jiangmen a fin de incubar proyectos relacionados con la IA. Se destinó personal de otras secciones para colaborar en proyectos especiales de desarrollo de modelos de IA. Las tareas de reconocimiento de riesgos y selección de objetivos realizadas por personas se sustituyeron gradualmente por procesos informatizados. Tras cinco años de investigación y desarrollo, proyectos piloto y promoción, el enfoque fue adoptado en 260 puertos marítimos y aeropuertos de todo el país. En 2023, se controlaron 22.642 declaraciones utilizando las nuevas herramientas analíticas, con una tasa de detección muy superior a la del análisis humano.
Construcción de una base de datos unificada
Las aduanas chinas han recopilado datos de múltiples fuentes de manera exhaustiva y han formado un lago de datos con más de 15.000 tablas de datos y más de 260.000 millones de entradas de datos de forma centralizada y local.
Las fuentes de datos proceden principalmente de cinco ámbitos:
- más de 300 tipos de datos aduaneros internos, como datos de las declaraciones aduaneras, datos de los manifiestos, datos de las inspecciones, datos de la lucha contra el contrabando y datos de la gestión de las empresas;
- datos de otros organismos gubernamentales, como datos fiscales, datos de mercado, datos de facturas, datos de divisas y datos de pasajeros;
- datos de las administraciones aduaneras;
- datos comerciales adquiridos a empresas de servicios de datos; y
- datos disponibles públicamente en Internet.
Estos datos se almacenan físicamente aplicando estándares de datos unificados, y suponen la base para que el análisis de los macrodatos y las aplicaciones de IA encuentren pistas ocultas e identifiquen riesgos.
Creación de conjuntos de datos para cada actividad
A continuación, el lago de datos se utiliza para crear múltiples conjuntos de datos de acuerdo con un modelo de “una actividad, un conjunto de datos”. Según las características de las diferentes actividades aduaneras, como el despacho de aduana, la supervisión, el control de riesgos, la inspección de mercancías, los aranceles, la gestión empresarial y la auditoría posterior al despacho, se identifican los datos relevantes en el lago de datos y se recopilan en una tabla que sirve de conjunto de datos para que los expertos lleven a cabo el análisis de los mismos. En estos momentos las aduanas chinas ya han creado más de 100 conjuntos de datos que conectan varios silos de sistemas de abajo hacia arriba, con lo que los datos fluyen plenamente entre los distintos sistemas.
Desarrollo de una plataforma unificada de análisis de datos
Se ha creado una plataforma para que el personal de las aduanas chinas utilizar los datos, cultivar una cultura de datos y posibilitar que cada funcionario se convierta en un analista de datos. Se llama “Cloud Engine”, en inglés, y cuenta con más de 3.000 usuarios diarios activos. Cada día se llevan a cabo más de 28.000 análisis utilizando uno de los modelos analíticos o aplicaciones almacenados en la plataforma. En 2023, se identificaron así 2.917 casos de fraude.
Creación de un portal de datos unificado
Se ha creado un portal de datos para ofrecer un único punto de entrada hacia todos los datos y todos los catálogos de datos existentes, y ayudar a los usuarios a encontrar los datos que necesitan.
Creación de un grupo de modelos inteligentes
Las aduanas chinas apoyan a los funcionarios para que sean capaces de realizar análisis de datos a través de la plataforma “Cloud Engine”, y al mismo tiempo quieren automatizar el proceso de análisis de riesgos explorando el uso de un modelo de aprendizaje automático creado a partir de algoritmos.
El modelo se basa en los datos históricos procedentes de fuentes aduaneras internas y externas, y utiliza algoritmos Catboost/XGBoost de código abierto para crear un programa que proporciona una puntuación inteligente de los riesgos en tiempo real para cada declaración aduanera, empresa y mercancía. Está conectado al sistema de operaciones de riesgo de las aduanas para identificar el riesgo de las declaraciones aduaneras en el despacho de aduanas en tiempo real.
El principio de la construcción del modelo es el siguiente:
- se creó una base de datos a partir de datos aduaneros internos y externos, incluidos formularios de declaraciones aduaneras, manifiestos, informes de empresas, documentos logísticos, informes de inspecciones, expedientes de lucha contra el contrabando, resultados de auditorías e inspecciones, flujos de fondos e información de los seguros;
- se creó una biblioteca de 105 características de riesgo, 76 de las cuales proceden de los indicadores de riesgo del Compendio de Gestión de Riesgos de la OMA. Algunas características de riesgo se desarrollaron gracias a la experiencia de los expertos, y otras se calcularon mediante algoritmos;
- para crear el modelo se utilizó el algoritmo de IA CatBoost, asignando un valor a cada declaración aduanera. Se establecieron dos umbrales: un umbral de riesgo alto, T1, y un umbral de riesgo bajo, T2. Las declaraciones con valores superiores a T1 se interceptan y las mercancías se inspeccionan; las declaraciones con valores previstos inferiores a T2 son objeto de levante inmediato; las declaraciones con valores previstos entre T1 y T2 se transmiten a los expertos.
Tras cinco años de desarrollo y pruebas, el modelo se ha puesto en práctica en todo el país. Se ha comprobado que el modelo es más preciso que los controles aleatorios y puede desvelar riesgos que los funcionarios encargados de la selección de objetivos podrían no encontrar, como los riesgos relacionados con empresas nuevas o materias primas. Por último, el modelo garantiza la coherencia de los controles, a diferencia del personal que decide lo que hay controlar, ya que sus capacidades y normas de aplicación difieren según estén en una parte u otra del país.
Las aduanas chinas han establecido las “Medidas de gestión del modelo de aplicación de macrodatos aduaneros”, con las que se normalizan los procesos de investigación y desarrollo, pruebas, promoción y desmantelamiento del modelo. Lo han hecho para gestionar el ciclo de vida completo del modelo. Al mismo tiempo, se ha establecido un sistema de índice de evaluación del desempeño del modelo para evaluar periódicamente su eficacia y aplicar ajustes dinámicos.
Además, se han llevado a cabo pruebas y ensayos en ámbitos clave y en distintas fases de las operaciones del despacho de aduana, lo que ha dado pie a la creación de múltiples modelos desarrollados de forma independiente. Algunos están diseñados para identificar residuos sólidos, mercancías peligrosas y artículos comprados en línea. Otros examinan las declaraciones y los certificados aduaneros. De este modo se crea un grupo de modelos. El objetivo es construir un modelo en cualquier sitio en el que se lleven a cabo operaciones aduaneras, utilizar modelos de IA para reemplazar las operaciones manuales y, en última instancia, construir una Administración de Aduanas moderna, digital e inteligente, capacitada por los datos y los modelos.
Tras años de análisis y práctica, las aduanas chinas consideran que las administraciones aduaneras no sólo han de aplicar más la IA , sino también aumentar la cooperación mutua en estos ámbitos. En 2023, y teniendo esto en cuenta, aunaron esfuerzos con la Secretaría de la OMA para lanzar el Proyecto Aduanas Inteligentes a fin de facilitar el intercambio de información y compartir aplicaciones tecnológicas y soluciones innovadoras entre las administraciones aduaneras. Además del intercambio de información y experiencias, las aduanas chinas creen que todos saldrían ganando con la colaboración en el ámbito de la IA. Un ejemplo es la creación de una plataforma en la que las administraciones aduaneras puedan cooperar basándose en acuerdos bilaterales o multilaterales.
Más información
Gao Fengrong
gaofr@sina.cn