Smart Big Data

Por Luis Morales, Gerente de Soluciones de Novatech.

Las conductas empresariales indebidas, los actos de corrupción de funcionarios públicos y las amenazas criminales han llenado las portadas de los periódicos locales e internacionales en los últimos años. Parecería que la tendencia de cometer crímenes e infringir la ley ha ido en aumento, pero lo cierto es que esto podría ser solo una ilusión. No necesariamente se comenten hoy día un mayor número de actos fraudulentos, ilegales y/o criminales, sino que, gracias a los avances tecnológicos, ahora se puede rastrear y sacar a la luz este tipo de acciones.

Lo que sí podemos asegurar es que, gracias a esos mismos avances tecnológicos, los casos de fraudes y actos ilícitos sin requerir grandes inversiones ni actos muy elaborados son cada vez más frecuentes. Hasta hace unos pocos años, robar un banco era algo que requería todo un grupo de gente armada con una planificación que parecería sacada del libreto de una película de Hollywood; mientras que ahora, una sola persona sentado al frente de su computador en alguna parte al otro lado del mundo es capaz de extraer dinero de cuentas bancarias, robar identidades y contraseñas personales de los portales de comercio electrónico o hacer que un sistema informático vital para un negocio se caiga.

Fuente del gráfico: World Economic Forum, Zurich

A pesar de esto, son cada vez más las empresas que se vuelcan a vender por Internet para satisfacer a sus clientes actuales, atender nuevos segmentos y ganar oportunidades de mercado, ofreciendo cada vez más valor de la mano de la tecnología.

En este artículo no vamos a centrarnos en cómo proteger a las compañías con soluciones de seguridad, sino en cómo el BigData puede ayudar a las empresas a detectar anomalías para evitar posibles fraudes y ciberataques.

El concepto de BigData engloba a una serie de herramientas y métodos que permiten a las empresas afrontar este problema creciente. A continuación, mencionamos 5 de ellos:

TRABAJO CON LOGS

En la actualidad, casi todos los sistemas informáticos guardan un registro de la actividad del mismo. Esos registros se los conoce como logs. Estos nos permiten saber, por ejemplo, quién realizo una transacción no aprobada, quién accedió a un sistema y cambió algo que no debía, quién busco o copió algo para lo cual no tenía permiso; cambios que a simple vista podrían ser imperceptibles.

Muchas compañías ven a estos registros como algo que no dan mayor utilidad y que al ser grandes volúmenes de información prefieren borrarlos periódicamente antes que guardarlos. Menos aún explotarlos.

Sin embargo, a través de herramientas de BigData, para empezar, podríamos almacenar todos esos volúmenes de datos como respaldos, permitiéndonos guardar bitácoras y ver datos que individualmente tiempo parecerían nada importantes, pero que al juntarlos representan un gran perjuicio para una empresa. Un ejemplo sencillo puede ser que empiece a faltar unos pocos centavos o dólares y que por su valor son difíciles de detectar diariamente, pero que al sumarlos representan una gran suma y pérdida para la organización o para algún cliente.

También podríamos detectar fácilmente y en tiempo real quién realizó algo indebido. Es decir, no sería necesario esperar a una auditoria o cierre de mes en donde recién se vea que las cosas no cuadran sino que se detectaría la anomalía en el instante preciso que se está realizando el fraude.

Los logs son uno de los insumos más importantes para realizar los otros tipos de análisis que detallaremos más adelante.

ANÁLISIS Y CRUCE DE DATOS

Imaginemos el siguiente escenario en una típica empresa de retail. Se genera una devolución, pero este no se ve reflejado en el inventario. Al mismo tiempo, las comisiones de los vendedores no se ven modificadas al ser una venta no fructífera. Si lo veríamos de manera aislada, a lo mejor se vería registrada la devolución a nivel financiero, pero posiblemente no retornaría el artículo al inventario (físicamente) y el vendedor recibiría su comisión considerando esta venta.

Para poder detectar este problema tendríamos que esperar al cierre de mes o en el peor de los casos después de unos días luego de que el vendedor declaró el cumplimiento de su meta.

Una herramienta de BigData nos permitiría realizar este cruce rápidamente, pero además, empezar a detectar los productos, vendedores, proveedores, etc. donde más se da este tipo de anomalías.tallaremos más adelante.

GRAFOS

Tomemos el ejemplo anterior. Con BigData, a través de una técnica sencilla de grafos, podríamos estructurar la relación que existe entre proveedores, vendedores, clientes, productos, etc. y detectar lo que se conoce como prevalencia, la agrupación de personas con un mismo fin. Con ello, se puede llegar a revelar un posible fraude. Según Forbes, la principal causa de fraude en Latinoamérica se da en este tipo de situaciones.

ALGORITMOS AVANZADOS

El pilar fundamental en BigData son los algoritmos que vamos a usar para analizar los datos; es ahí donde realmente sacamos provecho del volumen de datos que registramos y donde podemos llegar a monetizarlos.

Para explicar este punto vamos a tomar como ejemplo la Ley de Benford. Este es uno de los algoritmos más usados en la actualidad en casos de fraudes electorales y fraudes de declaraciones al fisco.

¿Sabías que los números aleatorios no manipulados por agentes externos tienen un comportamiento predecible? Pues el físico Frank Benford se percató de esto y creó la ley que lleva su apellido.

La Ley de Benford, o conocida también como la ley del primer dígito, explicada brevemente nos dice que, en la vida real, es más probable que el primer número que aparezca sea el número uno, y que según el número aumenta (es decir, 2, 3, 4, etc.), éste tiene menor probabilidad de aparecer.

Cuando algo se desvía de este comportamiento, se puede detectar más fácilmente el acaecimiento de una anomalía. Por ejemplo, el número de votos de un candidato, el valor da las facturas declaradas, número de devoluciones, el censo poblacional, etc.

MACHINE LEARNING

Imagine ya no tener que desarrollar infinitas reglas para poder detectar una anomalía, sino que el sistema auto aprenda el comportamiento normal de su compañía y empiece a alertarnos de cosas que ocurren fuera de lo común. El BigData, a través de una de sus más poderosas herramientas, el Machine Learning, es capaz de lograr eso para su empresa.

GRUPO NOVATECH

Es la firma líder del Ecuador en Consultoría Estratégica e implementación de Soluciones Tecnológicas Empresariales. A lo largo de 22 años de trayectoria, ha servido con éxito a más de 600 empresas en el Ecuador y en la Región Andina, con soluciones tecnológicas líderes en el mercado mundial, siempre acompañadas con consultoría especializada para su sector y una estructura de soporte ágil.