Detección de fraude dentro del ramo SOAT: Nuestra experiencia con Machine Learning

El desarrollo de nuevas herramientas tecnológicas basadas en el aprendizaje de máquina (o Machine Learning) ha representado una revolución para diferentes compañías a nivel mundial. Con el auge de muchos sistemas de información y la disponibilidad cada vez mayor de cantidades importantes de datos, se desprende una oportunidad histórica para hacer de la estadística un factor clave de cara al desarrollo de muchos modelos de negocio.

Desde la estadística se puede predecir el comportamiento de un conjunto de agentes, pasando por el ejercicio de revelar tendencias escondidas en la información, hasta concluir con métricas cada vez más dicientes y loables. El poder de los datos parece estar forjándose un lugar dentro de muchas discusiones sociales.

En INIF sabemos esto y hemos desarrollo un modelo estadístico que permita clasificar y predecir siniestros fraudulentos en el ramo SOAT, además de pronosticar el número de accidentes de tránsito atendidos en un conjunto de ciudades e IPS específicas. Para cumplir con sus objetivos se tuvo en cuenta una serie de condiciones que cumplían con la de cualquier algoritmo de aprendizaje automático:

En primer lugar, el modelo se entrenó con un número de registros lo suficientemente grande para minimizar las probabilidades de error en los resultados, para esto se usó la información del Sistema de Información de Reporte de Atenciones en Salud a Víctimas de Accidentes de Tránsito (SIRAS), el cual se compone de una serie de bases de datos transversales de las compañías de seguros con información recolectada al momento de la atención por parte de la IPS (entidad proveedora de salud).

En segundo lugar, se validó que los resultados generados por el algoritmo en la última etapa de su evaluación fueran parecidos a los obtenidos en la etapa de entrenamiento. Para ello, se dividió el conjunto de datos en dos muestras condicionadas a la fecha de registro del siniestro. Esto produjo un porcentaje de exactitud cercano al 97%.

Por último, con el objetivo de que el modelo sea simple pero efectivo, se usó el método XGBoost (Extreme Gradient Boosting), el cual se basa en la generación iterativa de múltiples modelos de predicción “débiles” que se alimentan entre sí mientras aprenden de sus errores, para posteriormente generar un modelo más “fuerte”, con mejor poder predictivo y mayor estabilidad en sus resultados.

Esta asociación de características permitió que se llegara a un producto deseable de cara a la prevención y mitigación del fraude al interior del ramo SOAT y clave para la toma de decisiones en las compañías que la implementen.

Este desarrollo hace parte del propósito de INIF para edificar una cultura basada en la honradez y la legalidad. Además, hace parte de un proceso de crecimiento dentro del sector, crecimiento que se espera sea alimentado por el oro de nuestros tiempos: los datos.

Te puede interesar

Tendencias de fraude 2024

El fraude es un fenómeno que por años ha generado un impacto económico, social y reputacional, debido a las malas prácticas que cometen los defraudadores

5 tips para hacer una gestión efectiva del fraude.

El fraude es una amenaza latente que evoluciona y se trasforma de acuerdo con los cambios del entorno, con frecuencia, los defraudadores van un paso

Claves para prevenir el fraude online

Sin duda alguna estamos en la era de la inteligencia, la tecnología y los datos, lo que nos ha permitido alcanzar un estilo de vida

Resumen de privacidad

Este sitio web usa cookies para mejorar tu experiencia mientras navegas a través del mismo. Fuera de eso, los cookies que están categorizados como necesarios están almacenados en tu navegador debido a que son esenciales para el funcionamiento básico de la página. También usamos cookies de terceros que nos ayudan a analizar y entender como usas este sitio web. Estos serán almacenados en tu navegador únicamente con tu consentimiento. También tienes la opción de no permitirlos, pero desactivándolos podrías afectar tu experiencia de navegación

Necesarios

Siempre activado

Funcionales

Las cookies funcionales ayudan a realizar ciertas funciones como compartir el contenido del sitio web en redes sociales, recolectar retroalimentaciones y otras características de terceros.

Cookie	Duración	Descripción
__wpdm_client	Sesión	Permite llevar control sobre las descargas del sitio

Rendimiento

Las cookies de rendimiento son usadas para entender y analizar los índices claves de rendimiento que ayudan en entregar una mejor experiencia a los visitantes.

Cookie	Duración	Descripción
__trf.src	12 meses	Guardar la referencia del origen de la visita del usuario al sitio
rdtrk	12 meses	Guardar la lista de todas las páginas que visitaste dentro del sitio web incluso antes de acceder(Solo para saber de qué sitio proviene la visita)

Analítica

Las cookies de analítica son usadas para entender como los visitantes están interactuando con el sitio web. Estas cookies ayudan a proveer información y métricas como el numero de visitantes, el tráfico del sitio, etc.

Cookie	Duración	Descripción
_ga	2 años	Se usa para distinguir a los usuarios.
_ga_#######	2 años	Se usa para mantener el estado de la sesión.
_gat_gtag_#######	1 minuto	Se usa para limitar el porcentaje de solicitudes.
_gid	2 años	Se usa para distinguir a los usuarios.