OMA – Un modelo analítico para la detección de fraudes y curso online avanzado

0
92

La OMA se complace en anunciar que el modelo LITE DATE para la detección de fraudes con el curso avanzado de análisis de datos ya está disponible en inglés y francés en CLiKC a partir del 17 de junio, con el apoyo del Fondo Corporativo de Aduanas de Corea (CCF-K).

En línea con el enfoque de la OMA en el análisis de datos para fines aduaneros, el proyecto BACUDA continúa brindando algoritmos de código abierto de acuerdo con las necesidades de los miembros y las actividades de desarrollo de capacidades que lo acompañan.

¡La última incorporación es el modelo LITE DATE con el código fuente y las explicaciones incluidas en el curso Advanced Data Analytics en CLiKC! Plataforma de aprendizaje electrónico.

LITE DATE, fácil y sencillo de usar

LITE DATE es una versión lite del modelo DATE desarrollado en 2020 como parte del proyecto BACUDA, en el sentido de que la estructura del modelo se ha simplificado para un uso más amplio sin perder su funcionalidad. Después de la publicación del modelo DATE y el lanzamiento del curso intermedio, que cubría el algoritmo y el código fuente del modelo DATE, los miembros expresaron su necesidad de abordar la dificultad del modelo debido a sus requisitos de GPU, bibliotecas y técnicas de programación complejas.

En este sentido, el modelo LITE DATE se desarrolló en respuesta a esos comentarios y recomendaciones para que sea un modelo fácil de practicar, comprender y ejecutar sin una GPU de alto rendimiento.

Mientras que el modelo DATE original tiene como objetivo detectar el fraude prediciendo la cantidad de ingresos adicionales, el modelo LITE DATE realiza solo la primera tarea entre las funciones mencionadas anteriormente.

Aspectos clave de LITE DATE

El objetivo del modelo LITE DATE es detectar transacciones fraudulentas. Técnicamente hablando, es un modelo de clasificación binaria que tiene como objetivo clasificar la transacción dada en la clase de transacciones ilegales o en la clase de transacciones no ilegales. El clasificador XGBoost se utilizó para la clasificación binaria, que es un algoritmo de conjunto basado en árboles que utiliza el método de impulso.

Los datos utilizados para el modelo de capacitación son el conjunto de datos de declaración de aduana sintético creado y compartido por el equipo del proyecto. El conjunto de datos comprende 100 000 muestras sintéticas de datos de declaraciones de aduanas etiquetadas con los resultados de inspección sintéticos.

En términos de rendimiento, el modelo muestra un recuerdo del 79,9 % y una precisión del 20,8 % (el recuerdo es una métrica comúnmente utilizada para evaluar con precisión la detección de fraude de la IA).

De acuerdo con los resultados, se espera que el modelo pueda detectar alrededor del 80% de todas las transacciones ilícitas y reducir la cantidad de transacciones sujetas a inspección humana a un tercio mientras triplica su eficacia del 7% al 20,8%.

Para obtener más asistencia personalizada y cualquier pregunta sobre el curso, la OMA invita a los miembros a ponerse en contacto con el equipo del proyecto BACUDA de la OMA ( bacuda@wcoomd.org ).

Fuente: OMA