Es probable que la computación en la nube en un servicio en la nube certificado, compatible y correctamente ejecutado como Microsoft Azure sea mucho más segura que los servidores locales en su oficina o centro de datos. Sus datos están encriptados en reposo y en movimiento; los sistemas en la nube probablemente se parchean con más frecuencia y se configuran de manera más segura que sus servidores; y el acceso de administrador está bloqueado y habilitado solo para "acceso justo a tiempo" para ejecutar comandos específicos en ventanas de tiempo específicas. Además, los administradores tendrán verificaciones de antecedentes y trabajarán en ubicaciones seguras que requieren credenciales biométricas para obtener acceso.

Sin embargo, todavía hay problemas. Debes confiar en que el servicio en la nube almacena y administra tus datos de forma segura y no permite que sus administradores o terceros se los lleven. Sus propios administradores tienen acceso privilegiado a los datos en esta nube, por lo que debe protegerse contra las amenazas internas. Y cuando realmente quiera usar esos datos (para inteligencia artificial, análisis o simplemente para consultar una base de datos), si está usando el cifrado tradicional, primero debe descargarlo y descifrarlo, o debe almacenar sus claves de cifrado. .

VER: Informe especial: Una estrategia ganadora para la ciberseguridad (PDF gratuito) (República Tecnológica)

Esto puede ser un problema para la información confidencial o privilegiada (ya sea información de identificación personal protegida por legislación como GDPR, registros financieros o datos médicos), especialmente si intenta utilizar datos que otra organización que controla el cifrado ha compartido con usted. Los servicios como Azure Data Share permiten a las organizaciones administrar y controlar el intercambio de datos con socios, pero los datos solo se cifran en tránsito y en reposo.

El cifrado homomórfico conserva las estructuras matemáticas que subyacen a los datos cifrados, por lo que puede realizar cálculos en los datos sin descifrarlos. Si la función homomórfica cifra 400 como 4 y 200 como 2, puede dividir los números cifrados y obtener el mismo resultado que dividiendo los números no cifrados.

El cifrado en funciones de esquemas homomórficos reales es considerablemente más complicado: a menudo usan un cálculo matemático que involucra redes con un alto número de dimensiones, llamado problema de aprendizaje en anillo con errores (RLWE). Es al menos tan seguro como los esquemas de cifrado estándar, pero a diferencia de los métodos actuales, no es algo que las computadoras cuánticas puedan descifrar.

VER: La nube industrial: ¿por qué es la próxima? (Característica especial de ZDNet/TechRepublic) | Descarga la versión en PDF gratis (República Tecnológica)

El resultado del cálculo también está encriptado. Esto lo hace útil para proteger las cargas de trabajo que ejecuta en la nube, para realizar análisis agregados en la nube (donde busca grandes cantidades de datos, en lugar de los detalles específicos de una cosa), para la automatización y orquestación donde está encriptada. los datos podrían desencadenar un evento y, en particular, para administrar la cadena de suministro y la información de los socios fuera de su propia organización.

Si trabaja con un socio o proveedor, puede compartir datos cifrados y solo tener acceso a los datos que tienen en común, por lo que puede usar sus conjuntos de datos combinados para el aprendizaje automático. O bien, las organizaciones podrían recopilar información de los clientes que ya está encriptada, donde el cliente tiene la clave de encriptación y todavía está trabajando con ella, sin ver nunca los datos reales. Dado que el cifrado homomórfico ahora se puede usar con algoritmos de aprendizaje profundo, las futuras versiones de las ofertas de aprendizaje automático basadas en la nube, como Azure Cognitive Services, podrían funcionar con datos cifrados, ya sea traduciendo un contrato confidencial o registros médicos OCR, o analizando información genética para ver si alguien está en riesgo de sufrir un infarto, sin filtrar información.

La anonimización de los datos no es suficiente para protegerlos: una vez que comienza a trabajar con grandes cantidades de datos, las correlaciones o los errores de los usuarios hacen probable que los datos se vuelvan a identificar, accidentalmente o a propósito, pero eso no puede suceder si nunca se descifran. .

Esa es una gran visión: ¿cuánto de eso puedes hacer hoy?

Índice

Cómo hacer práctico el cifrado homomórfico

El cifrado homomórfico no es una idea nueva, pero tardó un tiempo en volverse práctico. Propuesto originalmente en 1978, no hubo ni siquiera un algoritmo teórico hasta 2009, y habría tomado un billón de veces más que un cálculo sin cifrar. En 2013, IBM Research redujo esto a un millón de veces más lento, por lo que una operación de datos que tomaría un segundo sin encriptación tomaría otros 12 días con encriptación homomórfica.

Microsoft Research ha adoptado un enfoque ligeramente diferente, especificando previamente algunos de los parámetros de consulta, como el tamaño del conjunto de datos, los campos específicos que se necesitarán, los límites del rango de datos en esos campos (por lo tanto, un campo de edad no será negativo o mayor a 150, por ejemplo) o la cantidad de cálculo que vas a hacer. Este cifrado homomórfico "práctico" es la base de Microsoft Research Simple Encrypted Arithmetic Library (SEAL), que abrió en 2018.

SEAL es una biblioteca de C++ con contenedores .Net Standard para C# y funciona en Windows, macOS y Linux. Está comenzando a integrarse en marcos de trabajo de nivel superior: HE-Transformer de Intel usa SEAL para realizar cálculos en datos cifrados con el compilador de redes neuronales Nervana nGraph y marcos como TensorFlow, por ejemplo. SEAL también incluye demostraciones para mostrarle cómo integrarlo en las aplicaciones: hasta ahora, esto cubre su uso con Azure Functions y en una aplicación de Android para el seguimiento del ejercicio. (Sí, podrían ser datos confidenciales: varios sitios de seguimiento de ejercicios basados ​​en la nube terminaron filtrando información de los detalles de la cuenta del usuario a la ubicación de las bases militares).

No puede realizar cálculos arbitrarios, pero especificar los parámetros significa que si bien todavía hay una sobrecarga significativa, en lugar de que las operaciones sean 12 órdenes de magnitud más lentas que trabajar con datos sin cifrar, esto no es solo tres o cuatro. En 2015, las redes neuronales que usaban cifrado homomórfico (que Microsoft llama CryptoNets) podían reconocer números escritos a mano con un 99 % de precisión a una velocidad de casi 60 000 por hora (en una PC Xeon de 3,5 GHz con Windows 10). Una sola predicción de OCR de CrypoNet tomó 250 segundos, pero también lo hicieron 4096 predicciones, porque el cifrado homomórfico es masivamente paralelo.

En una PC de escritorio con un Core i7 de un solo subproceso, dependiendo de la cantidad de cómputo que especifique la configuración que vaya a realizar, multiplicar números con SEAL toma entre aproximadamente 500 microsegundos y 105 milisegundos. Pero cuando promedia todos los números que puede procesar en paralelo, el tiempo se reduce a unos pocos nanosegundos por operación. Del mismo modo, la selección de datos de un gran conjunto de datos cifrados lleva segundos en lugar de días. Actualmente, SEAL es solo para CPU, pero dado que es tan paralelizable, agregar aceleración de GPU (que está en la hoja de ruta) debería mejorar el rendimiento en aproximadamente dos órdenes de magnitud.

VER: La web oscura: una guía para profesionales (PDF gratuito) (TechRepublic)

Esto lo hace conveniente, pero SEAL aún es más para problemas específicos y pequeñas cantidades de información confidencial que para procesar todos sus datos. Microsoft usa encriptación homomórfica en su sistema ElectionGuard para la verificación de votos de extremo a extremo. Para obtener un rendimiento más convencional, SQL Server Always Encrypted simula el cifrado homomórfico completo además del cifrado estándar mediante hardware de confianza.

La comunidad criptográfica también tiende a necesitar tiempo para adoptar nuevas técnicas de encriptación, comprender los problemas y trabajar en los estándares. Por lo general, esto toma alrededor de diez años y el cifrado homomórfico comienza a progresar a través del proceso de estandarización. Actualmente, la discusión es sobre las especificaciones de qué tan fuerte es el cifrado; el siguiente paso será obtener un conjunto común de API para que los criptosistemas homomórficos puedan interactuar.

Hoy en día, el cifrado homomórfico es algo que pensará detenidamente en aplicar, aunque vale la pena si le permite trabajar con datos específicos que de otro modo no podría usar. Pero una vez que veamos la estandarización y la aceleración del hardware, es probable que se adopte mucho más ampliamente en un futuro no muy lejano, dada la cantidad de datos confidenciales con los que las organizaciones quieren trabajar.

Cifrado: una hoja de trucos

Cómo las organizaciones pueden protegerse mejor contra las amenazas a la seguridad de la cadena de suministro

Por qué siguen ocurriendo violaciones de datos

Microsoft demuestra la tecnología ElectionGuard para proteger las máquinas de votación electrónica (ZDNet)