Lo primero de todo, ¿qué es Mágika exactamente? Pues bien, se trata de un innovador sistema basado en IA que el gigante de las búsquedas ha diseñado para revolucionar la forma en que se identifican los tipos de archivos binarios y textuales.
Magika destaca por su capacidad para ofrecer una identificación precisa de archivos en milisegundos, incluso cuando funciona en local en un ordenador.
Magika emplea un modelo de aprendizaje profundo, personalizado y altamente optimizado que ha sido meticulosamente diseñado y entrenado utilizando Keras. Este modelo es notablemente ligero, con un peso de tan solo 1 MB.
Cómo usa Google a Magika en su día a día
El rendimiento de Magika es impresionante. Cuando se evalúa en una prueba comparativa de 1 millón de archivos que cubren más de 100 tipos de archivos, Magika supera a las herramientas existentes en aproximadamente un 20%.
El rendimiento del sistema es aún mayor en el caso de los archivos de texto, incluidos los de código y configuración, que tradicionalmente han planteado problemas a otras herramientas.
A nivel interno, Google ya ha aprovechado Magika para mejorar la seguridad de los usuarios. El sistema se despliega a escala para dirigir los archivos de Gmail, Drive y Safe Browsing a los escáneres de seguridad y políticas de contenido adecuados.
Con Magika, Google ha observado una mejora del 50% en la precisión de la identificación del tipo de archivo en comparación con los sistemas anteriores que se basaban en reglas elaboradas a mano.
Este aumento de la precisión ha permitido escanear un 11% adicional de archivos con escáneres especializados en documentos maliciosos de IA y reducir el número de archivos no identificados al 3%.
Al abrir Magika, Google pretende ayudar a otros programas informáticos a mejorar su precisión en la identificación de archivos y proporcionar a los investigadores un método fiable para identificar tipos de archivos a gran escala. El código y el modelo de Magika ya están disponibles gratuitamente en GitHub bajo la licencia Apache2.