Data Governance frente a los nuevos paradigmas de la transformación digital
Sin duda alguna, todo avance tecnológico contribuye a aumentar la competitividad para distintos sectores, por lo que requiere constantemente opciones de diferenciación. Hace algunos años, esta diferenciación se realizaba en torno a la calidad del producto y su proceso de producción.
Actualmente el diferenciador gira en torno a la información, por lo que requerimos tener una información veraz, ordenada y correctamente gestionada. Es importante tener en cuenta que quien quiera aplicar este diferenciador en su empresa, debe hablar al mismo tiempo de una gobernabilidad de los datos que no tiene otro objetivo si no el de hacer una correcta gestión de los datos.
¿Qué es Data Governance?
Data Governance consiste en todo un mecanismo de ayuda en la toma de decisiones y responsabilidades relacionadas con el manejo de la información.
Cualquier individuo o grupo que este interesado en recoger, procesar, manipular, almacenar y disponer del uso del información debería estar interesado en Data Governance, lo que a su vez implica delegar a personas o grupos especializados de IT y gestión de datos las decisiones sobre como realizar las tareas relacionadas anteriormente.
Desarrollo de Data Governance
La implementación de un programa de Data Governance se define a su vez bajo cierta metodología, no es simplemente un reto que inicie con una hoja en blanco, sino que va regido bajo ciertos estándares.
- DMBOK: Data Management Book of Knowledge. Gestión y la Utilización de Datos.
- TOGAF: The Open Group Architecture Framework. Arquitectura de datos como parte de la arquitectura general de una empresa.
- COBIT: Control Objectives for Information and related Technology. Gobernabilidad general del área Tecnologías de la Información.
- DGI: Data Governance Framework. Es un marco de referencia simple para generar la Gobernabilidad de Datos.
Alcanzar un nivel de eficiencia en el trabajo de gobierno de grandes volúmenes de datos requiere una redefinición de las tecnologías actuales (Big Data, IoT y Cloud, además de una ampliación en los requerimientos de los frameworks. Esto esta supeditado a al proceso de transformación digital y modernización tecnológica tan acelerado que enfrentamos cada día. Y es que las limitaciones que viven las organizaciones actualmente están relacionadas con la extracción de dato reales y de alta calidad, y los riesgos a los que se enfrentan son en específico son muchas fuentes y tipos de datos, un alto volumen de datos, la disparidad del enfoque y casos de uso y los distintos flujos de procesamiento y almacenamiento con lo que pueden implementarse. El sistema, además es volátil y no existen estándares de calidad de datos unificados.
El escenario más cercano lo vivimos con el internet. La digitalización y la posibilidad de conectar en tiempo real a todos los actores sociales mediante este medio suele ser vago en su alcance, pues aún no se cuenta con la capacidad ni la tecnología necesaria para llevar a cabo un correcto gobierno de datos. Es importante tener en cuenta, al momento de desarrollar Data Governance, mejorar el uso compartido de la información, la protección de datos sensibles y gestionar el conjunto de datos a lo largo del ciclo de vida. Ahora bien, el ciclo de vida es un concepto importante dentro del gobierno de datos, a sabiendas de que permite definir y conocer los datos, su naturaleza y las fases por las que necesitan pasar para transformarse en información de valor.
Es importante también tener en cuenta los objetivos, metodología y agentes que queremos alcanzar por medio del gobierno de datos. De acuerdo a nuestro centro de investigación en España, estos conceptos se definen de la siguiente manera.
- Los objetivos pueden comprender aspectos como: el acceso y autorización de los datos, la seguridad perimetral, protección de datos y autenticación integrada, la encriptación, la constante auditoría y análisis, y como objetivo global construir una arquitectura de datos unificada.
- La metodología consta de ciertos pasos básicos como: 1) Establecer metas, 2) Definir métricas, 3) Tomar decisiones, 4) Comunicar políticas, 5) Medir resultados, y 6) Auditar.
- Y por último, los agentes sobre los que aplicar el gobierno del dato son tres: personas, tecnologías y procesos.
Es importante también definir la implementación en el plano tecnológico, teniendo en cuenta aspectos de soporte de seguridad y soberanía de datos.
Dentro del paradigma del Big Data existen varias tecnologías encargadas de este aspecto como Kerberos (autenticación), Apache Ranger (autorización/auditoria) o Apache Knox (punto de acceso único); así como existen otras que hacen todo el seguimiento y control al flujo de información, Apache Atlas.
Ahora bien, aplicar un programa de Data Governance necesita aplicarse en los casos en los que:
- La organización ha crecido y todavía se aplica una gestión tradicional que no soporta actividades multifuncionales relacionadas con los datos.
- Los sistemas de datos son demasiado complicados para enfrentar las actividades relacionandas con el manejo de datos.
- Los arquitectos de datos necesitan un soporte tecnológico que los ayude a tener una visión más clara sobre las preferencias y preocupaciones de datos de toda la empresa.
- La regulación, normas y requerimiento exige una data governance más formal