Imagen: HJBC/Shutterstock

Los datos son valiosos. Es el elemento vital de una empresa moderna y sustenta todo lo que hace. Eso significa que debe controlarlo, aunque solo sea para cumplir con las normas y evitar fuertes multas después de una violación de datos. Si sabe lo que tiene y dónde está almacenado, está listo para proteger lo que es importante y monitorear lo que no lo es.

VER: 83 trucos de Excel que todo usuario debe dominar (República Tecnológica)

Las plataformas en la nube como Microsoft Azure hacen que la generación de grandes cantidades de datos sea trivial, con almacenamiento y bases de datos como un servicio que puede replicar datos entre regiones, aprovisionados en minutos. Hay soporte para lagos de datos a gran escala, noSQL Cosmos DB replicado masivamente, tiendas MariaDB rápidas y SQL Azure familiar. Microsoft lo describe como una "cadena de suministro de datos" que cubre todo, desde datos sin procesar de sensores de Internet de las cosas y aplicaciones comerciales hasta espacios de trabajo analíticos utilizados por analistas comerciales y herramientas de bajo código de Power Platform, que trabajan con datos en las instalaciones y en la nube. . .

Con datos dispersos en gran parte de su patrimonio digital y tan fáciles de crear, lo que necesita es alguna forma de herramientas de gobierno de datos. No necesita controlar completamente sus datos, pero sí debe permitirle comprender dónde están y cómo se utilizan. También debería poder ayudar a los usuarios a encontrar los datos que necesitan para sus proyectos, exponiendo lo que se ha catalogado a cualquier persona con los permisos adecuados.

Índice
  • Presentación de Azure Purview
  • Cómo crear tu primer catálogo de datos en Purview
  • Cómo administrar permisos y secretos en Purview
  • Cómo usar los datos de Purview
  • Presentación de Azure Purview

    Aquí es donde entra en juego Azure Purview, que se basa en las propias herramientas internas de gobierno de datos de Microsoft. Es un conjunto de aplicaciones, con tres componentes clave: Azure Purview Data Map, Azure Purview Data Catalog y Azure Purview Data Insights.

    Azure Purview es principalmente una herramienta de descubrimiento de datos que le permite dirigirse a múltiples audiencias. Los desarrolladores y usuarios comerciales pueden tratarlo como un registro de las fuentes de datos disponibles. Puede ser difícil saber qué hay disponible en las aplicaciones o en las herramientas de análisis, por lo que tener un lugar donde se puedan encontrar los datos y la documentación facilitará mucho la vida de los usuarios. Lo mismo ocurre con los usuarios y los sistemas que producen esos datos, automatizando la producción de documentación y utilizando Purview como centro para compartir sus datos con el resto de la empresa.

    VER: Fotos: características de Windows 11 que debes conocer (República Tecnológica)

    Sin embargo, lo más importante es el equipo de seguridad. Ahora son los encargados de asegurarse de que la empresa cumple con la normativa de protección de datos, así como de controlar el acceso de usuarios y aplicaciones. Ejecutar Purview como una herramienta de registro y descubrimiento de datos automatizados les brinda la capacidad de usar sus herramientas para verificar datos confidenciales y agregar reglas de cumplimiento a los datos.

    Lo que ofrece Purview es relativamente simple. Es un servicio donde puede registrar sus servicios de datos y luego etiquetarlos con los metadatos apropiados. El catálogo resultante se indexa y se puede buscar, y cualquiera puede agregar nuevos metadatos a una fuente. Los metadatos pueden incluir características comunes de la base de datos, como nombres de columnas y tablas, así como tipos de datos y direcciones URL de API. Sus datos nunca salen de donde están almacenados: todo lo que sucede es que Purview actúa como una cámara de compensación central para sus datos, almacenando su ubicación junto con los metadatos de origen.

    Cómo crear tu primer catálogo de datos en Purview

    Es bastante simple comenzar con Purview: necesitará una cuenta de Azure y Azure Active Directory. Purview necesita permisos específicos, así que asegúrese de tener una política que permita que las aplicaciones creen una cuenta de almacenamiento y un espacio de nombres de EventHub, ya que el servicio los configurará automáticamente. Una vez instalado, registre Purview, Azure Almacenamiento y EventHub como proveedores de recursos, adjuntos a una suscripción con derechos de acceso administrativo.

    VER: Cómo cometer menos errores y trabajar de manera más eficiente con texto predictivo en Microsoft 365 (República Tecnológica)

    Ahora puede crear una cuenta Purview desde Azure Portal, eligiendo la capacidad que desea asignar a su cuenta. Con todo en su lugar, cree la cuenta e inicie su espacio de trabajo de Purview desde Azure Portal. Deberá configurar roles y cuentas, de forma inmediata, asignando roles a los usuarios en su AAD. Los usuarios pueden ser lectores de datos, conservadores de datos y administradores de fuentes de datos. La mayoría de los usuarios serán lectores, teniendo acceso al catálogo. Si administran fuentes y metadatos, conviértalos en curadores. Si ejecutan análisis, entonces son administradores de fuentes de datos.

    Cómo administrar permisos y secretos en Purview

    Antes de analizar sus datos, Purview necesitará tener acceso a las fuentes de datos. Puede hacerlo otorgando derechos de acceso a la identidad administrada de Azure Purview o usándola junto con las credenciales almacenadas en Azure Key Vault. Ambos tienen sus ventajas, pero si usa las prácticas recomendadas de Azure, probablemente querrá trabajar con Key Vault Secrets.

    VER: Microsoft Power Platform y desarrollo low-code/no-code: sacar el máximo partido a Fusion Teams (República Tecnológica)

    Configurar Purview para un análisis inicial puede llevar mucho tiempo, ya que proporciona vínculos a suscripciones y secretos, y configura los cmdlets de Azure PowerShell del servicio. El primer conjunto de scripts verifica las fuentes de datos disponibles en cada suscripción y si el servicio tiene derechos de acceso. No todos los orígenes de datos son compatibles actualmente con la vista previa de Azure Purview, pero sí aquellos que constituyen una parte significativa del uso de almacenamiento de datos de Azure. Y aunque hay muy pocas fuentes en las instalaciones en este momento, Microsoft planea aumentar drásticamente la cantidad de fuentes admitidas.

    Vale la pena dedicar mucho tiempo a documentar Azure Purview antes de ejecutar un análisis, ya que configurar fuentes de datos puede ser complejo. Guarde las fuentes y ejecute el primer escaneo desde la vista Mapa de datos en el portal de Purview, asegurándose de tener conectores para todos sus escaneos programados. Debido a que Purview puede funcionar fuera de Azure, deberá tener cuidado de no exponer accidentalmente secretos al mundo, especialmente para sistemas de línea de negocio como SAP HANA o recursos entre nubes como AWS S3.

    Cómo usar los datos de Purview

    Microsoft incluye gran parte de las herramientas de Purview en su Azure Purview Studio, una interfaz web para el servicio que expone gran parte del gráfico resultante de sus fuentes de datos. Los escaneos automáticos se pueden anotar con etiquetas de protección de datos para integrar sus datos en marcos de protección de datos familiares de Microsoft. Ahora hay más de 200 clasificadores diferentes integrados en Purview, para la generación automatizada de metadatos y puede crear sus propios clasificadores personalizados para datos específicos de la empresa y la industria.

    VER: Este punto de referencia de código abierto de Microsoft es una poderosa herramienta de prueba de servidor (República Tecnológica)

    Bajo el capó se encuentra la plataforma de código abierto Apache Atlas, con API que admiten la creación de sus propias aplicaciones y herramientas. Herramientas como Purview Catalog se basan en estas API, por lo que puede ver cómo Microsoft las usa para navegar por el gráfico de datos resultante, ayudándole a decidir qué quiere hacer y cómo quiere hacerlo.

    Es posible que Microsoft haya diseñado originalmente Purview para resolver sus propios problemas de gestión de datos, pero está claro que las herramientas resultantes son adecuadas para cualquier persona con una gran cantidad de datos que necesite saber lo que almacena. Si bien carece de una forma de determinar quién tiene acceso a estos datos, le brinda suficiente información para ayudar a determinar qué usuarios y aplicaciones tienen acceso y, lo que es más importante, formas de comenzar a controlar ese acceso.

    El control es esencial para una gobernanza eficaz y esencial para el cumplimiento normativo. Con una explosión de almacenamiento de datos entre nubes, local e híbrido, las herramientas como Purview van a ser esenciales para los CISO y los CTO.