¿Data Mesh o Data Fabric? Esa es la cuestión
En el mundo hiperconectado del cloud y el Internet de las Cosas (IoT), cada aparato de red de procesamiento está asociado a otro a través de una desconcertante red interconectada.
Las empresas actuales intentan convertirse en asociaciones impulsadas por los datos y obtener el máximo valor de estos. Sin embargo, el ascenso de la nube, el desarrollo del IoT, así como de otras tecnologías, han hecho que la información no se limite a las instalaciones locales. Esto representa un auténtico reto para la futura gestión de datos, ya que un objetivo definitivo de esta es compartir la información empresarial en diferentes etapas e innovaciones.
En este sentido, Data Lake y Data Warehouse son términos ya relativamente conocidos y de los que ya hemos hablado en nuestro Blog. No obstante, Data Mesh y Data Fabric son todavía términos algo menos populares.
¿Qué es Data Fabric?
Un Data Fabric integra datos en todas las infraestructuras empresariales, incluidos todos los despliegues en la nube, híbridos y locales. Conecta y aprovecha los entornos de red distribuidos y pone los datos en un formato común.
Por lo tanto, es un buen punto de partida para quienes buscan una forma de integrar los datos en un formato común y aprovecharlos a partir de ahí. También es una forma de añadir funciones de Machine Learning (ML) e Inteligencia Artificial (IA) a un sistema distribuido sin tener que desmontar y sustituir gran parte del sistema.
¿Qué es Data Mesh?
Por otro lado, Data Mesh es un enfoque moderno diseñado para permitir el escalado, centrándose en equipos funcionales descentralizados. En él, grupos de expertos en determinados ámbitos empresariales se encargan de conjuntos de datos, gobernanza, gestión y procesos específicos, alojando y sirviendo los datos a su discreción.
Con una arquitectura de Data Mesh, los datos se ven como un producto, lo que significa que su almacenamiento, fiabilidad, calidad, seguridad y gobernanza se consideran componentes de su valor.
¿Cuáles son las diferencias entre Data Mesh y Data Fabric?
Como ambos paradigmas de datos se crean para ayudar a la recopilación, gobernanza y distribución de datos, es fácil notar similitudes entre ellos. Sin embargo, las diferencias también son evidentes y deben tenerse en cuenta antes de que una organización se decante por un modelo.
Almacenamiento de datos descentralizado frente a centralizado
En un Data Mesh, los datos se distribuyen en dominios, sin un único punto de control necesario.
En un Data Fabric, el acceso a los datos está centralizado, con servidores de alta velocidad para compartir recursos en red y de alto rendimiento.
Automatización frente a enfoque de inclusión humana
Los Data Mesh tratan los datos como un producto y confían en los propietarios de los dominios para impulsar los requisitos del producto de datos.
Data Fabric, sin embargo, se basa en la automatización para descubrir, gobernar, sugerir y entregar datos a los consumidores de datos. Esta automatización se basa en una rica base de metadatos.
Arquitectura
El paradigma del Data Mesh es independiente del lenguaje y la tecnología y se centra más en los cambios organizativos. La arquitectura de Data Mesh sigue un diseño basado en el dominio y el pensamiento de producto.
Por otro lado, el Data Fabric es una solución de integración de datos más técnica. La arquitectura Data Fabric también es más compatible con los datos técnicos, empresariales y operativos.
Entonces… ¿Qué modelo elegir?
Es concebible que los Data Fabrics tomen la delantera en los próximos años en lo que respecta a la gestión eficaz de los datos. Los Data Fabrics conectan los datos de toda la organización y facilitan el intercambio de datos sin fricciones.
Dado que los Data Fabrics se centran en la automatización, podemos optimizar la gestión de datos y enviar perspectivas y análisis en tiempo real a los usuarios de datos. Además, los Data Fabrics son muy rentables y ofrecen mayor seguridad: la capa de virtualización garantiza que los datos no se muevan innecesariamente.