Gracias a la creación de un sistema integrado de gestión de riesgos basado en la inteligencia artificial y el aprendizaje automático, la Aduana de India ha logrado avances significativos en el desarrollo de capacidades sistémicas y en tiempo real para la selección de objetivos. Uno de los pilares fundamentales de este sistema es la codificación de los datos de los proveedores y las descripciones de los productos. El presente artículo explica cómo funciona la codificación y cómo se utiliza para analizar las redes de la cadena de suministro, generar automáticamente información sobre los riesgos y detectar anomalías en la valoración.
Codificación de empresas: el eje central de la selección automatizada de riesgos
La evaluación automatizada de riesgos y la selección de objetivos en las aduanas hunde sus raíces en la disponibilidad de datos codificados y legibles por máquina. La codificación de todas las empresas de la cadena de suministro permite que las Administraciones de Aduanas aborden de forma más eficaz tanto los riesgos relacionados con la recaudación como los que no lo están, al tiempo que se establecen redes sólidas para un análisis exhaustivo de los riesgos. Si bien a las empresas de la cadena de suministro, como los importadores y los agentes de aduanas, ya se les han asignado códigos únicos, la información sobre los proveedores extranjeros se recoge tradicionalmente en formatos de texto libre dentro de las declaraciones de importación. La ausencia de datos estructurados constituye un gran obstáculo para el análisis automatizado de riesgos, especialmente cuando un mismo proveedor suministra mercancías a múltiples importadores en todo el país.
Asignación de códigos únicos a proveedores ubicados en el extranjero
Para abordar este problema, se decidió asignar un identificador único a los proveedores en función del nombre y dirección profesional que figura en la declaración de importación. Se elaboró un modelo de aprendizaje automático no supervisado para llevar a cabo esta tarea. Inicialmente, los nombres y direcciones de los proveedores extraídos de las declaraciones de importación se limpiaron y tipificaron utilizando técnicas de procesamiento del lenguaje natural y análisis de texto. A continuación, se aplicaron algoritmos de coincidencia de cadenas para evaluar la similitud entre las declaraciones de los proveedores, para después agrupar algoritmos de entidades que presentan un alto grado de coincidencia con arreglo a umbrales predefinidos. Para determinar la proximidad de los datos simples respecto a los agregados, se emplearon algoritmos de distancia como la distancia Jaro-Winkler y la distancia Levenshtein.
El resultado fue un código de proveedor, un identificador único asignado a todos los proveedores en función de características fundamentales como el nombre, la dirección y el país. Por ejemplo, las variaciones en los datos del proveedor que se enumeran a continuación, todas ellas referidas al mismo proveedor, se integran en un único código : A88000001

Esta codificación permite que el sistema de gestión de riesgos en el ámbito aduanero trate todas estas variantes como un único proveedor, lo que permite una selección más precisa y un análisis más exacto de la red de la cadena de suministro.
Codificación de las descripciones de los productos para combatir los riesgos relacionados con la recaudación
Asentada en la codificación de proveedores, la codificación de descripciones desempeña un papel fundamental en la detección de riesgos relacionados con la recaudación, como los errores de clasificación y la subvaloración. Las descripciones de los productos, tal y como se declaran en las facturas y declaraciones de importación, suelen ser desestructuradas e incoherentes, incluso cuando el mismo proveedor envía mercancías idénticas.
Para solucionar este problema, la Aduana de la India ha implementado la codificación de descripciones, un modelo de aprendizaje automático no supervisado que asigna un indicador de descripción tipificado a los productos suministrados por cada proveedor codificado. El proceso de codificación de descripciones se compone de diversas etapas en las que se utiliza el aprendizaje automático para convertir las descripciones de productos no estructuradas en datos tipificados. Las descripciones en formato de texto libre se extraen de las declaraciones de importación. Se utiliza el procesamiento del lenguaje natural para limpiar y tipificar el texto eliminando detalles irrelevantes, como la puntuación o las palabras vacías. Las descripciones similares se aglutinan utilizando algoritmos de agrupación y métricas de similitud de texto. A los artículos con un alto grado de similitud textual y semántica se les asigna el mismo identificador de descripción.
Este identificador de descripción vincula las descripciones diversas de un mismo producto suministrado por un mismo proveedor a una única categoría analizable. Tomando como referencia el ejemplo anterior, el proveedor A88000001 describe los mismos repuestos de automóvil de diversas maneras, tal y como se muestra en la tabla siguiente.

Si bien están redactadas de forma distinta, todas las variantes anteriores se reconocen como el mismo producto del mismo proveedor y se les asigna el identificador de descripción «1». Esto permite a la Aduana comparar los valores declarados para el mismo producto del mismo proveedor entre diferentes importadores, señalar los envíos subvalorados y garantizar la clasificación adecuada de las mercancías.
Análisis de la red de la cadena de suministro
La codificación de empresas permite a las autoridades aduaneras analizar las relaciones entre los principales actores de la cadena de suministro, a saber, proveedores, importadores, agentes de aduanas y puertos de importación, para que la evaluación de riesgos y la selección de objetivos resulten más precisas.
El modelo de análisis de red extrae datos principalmente de las declaraciones de importación y exportación, utilizando parámetros esenciales, como los números de identificación de importadores/exportadores, el código de los agentes de aduanas y los identificadores codificados de los proveedores. Se extraen los datos pertinentes de los sistemas de origen para cada número de identificación de entidad proporcionado y, a continuación, se limpian y tipifican dichos datos mediante técnicas de análisis de texto y procesamiento del lenguaje natural. Así pues, estos datos sirven para construir redes precisas en la que se identifican y etiquetan de forma clara los nodos individuales, que representan a los proveedores, importadores/exportadores y agentes de aduanas. Mediante técnicas avanzadas de modelización de redes, estos nodos se conectan para formar una red completa de relaciones en la cadena de suministro. Una herramienta de visualización de redes muestra estas redes interconectadas, lo que permite a los funcionarios de aduanas explorar las conexiones entre empresas o entidades, detectar anomalías e identificar empresas y transacciones de alto riesgo.
Modelos avanzados de gestión de riesgo
El éxito de la implementación de la codificación de empresas y descripciones ha sentado las bases para un conjunto de modelos de gestión de riesgos diseñados para mejorar la precisión de la selección de objetivos, la toma de decisiones y la eficacia operativa en la Aduana de la India.
El primer modelo de «Segmentación predictiva basada en proveedores y descripciones» aplica objetivos o prohibiciones específicos a los proveedores identificados como de alto riesgo, lo que permite una selección granular y específica de cada empresa.
El «modelo de valoración basado en el aprendizaje automático», que utiliza la codificación de los proveedores y los identificadores descriptivos para determinar el valor declarado de las mercancías en tiempo real, constituye uno de los avances fundamentales para la Aduana de India. Al comparar los valores declarados de un artículo en los envíos en curso con los datos históricos de las mismas mercancías del mismo proveedor, el modelo elabora instrucciones automatizadas y generadas por máquina para los funcionarios, junto con puntos de referencia basados en patrones de declaración anteriores, lo que permite una valoración precisa y la detección de fraudes.
Otro avance notable es el «Módulo de información», que utiliza inteligencia artificial y aprendizaje automático para proporcionar un análisis completo 360 grados de proveedores, importadores, agentes de aduanas y productos básicos. Este módulo emplea el análisis de red para evaluar los patrones de comportamiento de las empresas que participan en transacciones comerciales, y proporciona información documentada sobre los riesgos específicos de cada una, lo que ayuda a los funcionarios a detectar anomalías y tendencias en el comportamiento empresarial.
La «Herramienta de análisis posterior a la incautación» está diseñada para generar información específica para cada tipo de infracción mediante el análisis relacional, utilizando la codificación de los proveedores y los identificadores de descripción. Esta herramienta se utiliza fundamentalmente para analizar los tipos de conducta de los proveedores, importadores y agentes de aduanas implicados en transacciones fraudulentas. Contribuye a la puntuación de riesgos y mejora las capacidades predictivas del sistema de gestión de riesgos. Las infracciones registradas influyen directamente en la elaboración de perfiles de riesgo de las empresas asociadas, lo que hace que las evaluaciones futuras sean más precisas.
El «Modelo de correlación Proveedor / Importador» ofrece información detallada sobre los importadores y los agentes de aduanas asociados a un proveedor determinado. De este modo, los funcionarios de aduanas pueden evaluar las credenciales del proveedor y tomar decisiones bien fundadas sobre el riesgo que supone dicho proveedor. Por último, la «base de datos de infracciones» actúa como un directorio centralizado de infracciones relacionadas con los códigos de empresas y los identificadores de descripción. Esta base de datos permite lanzar alertas de riesgo en tiempo real y avisos para los funcionarios de aduanas en primera línea, ofreciendo información sobre el comportamiento de los proveedores, importadores y agentes de aduanas en el pasado. También desempeña un cometido fundamental en la detección activa de envíos de alto riesgo, cotejando los códigos de los proveedores, los códigos de los importadores y los identificadores de los productos con los patrones registrados en materia de infracciones.
La precisión de estos modelos de gestión de riesgos se mide periódicamente mediante indicadores clave de desempeño (KPI). Se mide fundamentalmente la precisión con la que los modelos de gestión de riesgos identifican los envíos de alto riesgo, la recaudación obtenida al señalar errores de clasificación o subvaloraciones de mercancías, la precisión de la selección predictiva de las empresas basada en su desempeño pasado, el índice de falsos positivos y el índice de detecciones.
La utilización de estos modelos logró grandes resultados y permitió, por citar algunos ejemplos, la incautación de aproximadamente 294 kg de heroína introducida de contrabando desde Afganistán en el puerto de Nhava Sheva, de unos 883 kg de metanfetamina ocultos en un envío marítimo de importación y de 7,9 millones de cigarrillos de marca extranjera. También se descubrieron múltiples envíos ilícitos de residuos electrónicos y otros artículos prohibidos o restringidos, así como casos de fraude comercial.
Transformar los datos en información útil
La integración de modelos de inteligencia artificial y aprendizaje automático en el sistema de gestión de riesgos de la Aduana de India está dando resultados cuantificables en tiempo real. Estos modelos generan alertas diarias e información que respalda la toma de decisiones de los funcionarios de aduanas en primera línea, mejorando así sustancialmente la precisión y la eficacia de las medidas de fiscalización. La codificación de empresas y los identificadores de descripción tipificados constituyen el cimiento donde se asientan otros modelos avanzados de inteligencia artificial y aprendizaje automático utilizados en la gestión de riesgos en el ámbito aduanero. Al transformar los datos no estructurados de la declaración en formatos estructurados y legibles por máquina, la Aduana de India ha mejorado su capacidad para detectar con mayor precisión tanto los riesgos relacionados con la recaudación como los que no lo están, reforzando así la seguridad del comercio transfronterizo. En consecuencia, la gestión eficaz de los riesgos y la circulación segura de mercancías contribuyen a la prosperidad de todas las partes interesadas que participan en el comercio internacional.
Para más información
sruti.vijayakumar@gov.in
shivam.dhamanikar@gov.in