Cloudera lanza SDX, una experiencia de datos compartidos

Con SDX es posible crear y gestionar de forma segura las aplicaciones de análisis multifunción. SDX, además, facilita integrar soluciones de empresas certificadas por Cloudera para mejorar aún más la capacidad de la plataforma.

Publicado el 10 Oct 2017

Cloudera lanza SDX, una experiencia de datos compartidos

Cloudera, la plataforma de machine learning y analítica de datos optimizada para la nube, ha lanzado Cloudera SDX, un software modular que ofrece a las empresas una experiencia de datos compartida. Con un sistema que centraliza de forma coherente el propio proyecto, la seguridad y la administración de los datos, SDX hace posible que numerosas aplicaciones de sus clientes no solapen sus datos. Algunas iniciativas de nivel ejecutivo, como la ciberseguridad, productos y servicios conectados o incrementar el valor para el cliente, requieren que múltiples y complejas aplicaciones funcionen interconectadas. Por ejemplo, el Internet de las Cosas (IoT, por sus siglas en inglés) a menudo requiere de recopilación de datos, analíticas ad hoc, machine learning y datos en lote o en tiempo real. Las mejores plataformas utilizan juntos machine learning y procesamiento en tiempo real. En muchos casos, los clúster de aplicación multifunción o trabajan en infraestructuras cloud o se basan en datos que han sido generados en la nube.

Desarrollar estas aplicaciones tan complejas es todo un reto para clústers con varios usuarios, y particularmente difícil en entornos cloud, ya que la contextualización y las políticas de datos no persisten en ambientes cambiantes. Es más, la mayoría de servicios cloud son, en realidad, aplicaciones que funcionan alojadas en un clúster aislado. Con SDX es posible crear y gestionar de forma segura estas aplicaciones de análisis multifunción. SDX, además, facilita integrar soluciones de empresas certificadas por Cloudera para mejorar aún más la capacidad de la plataforma.

Una de las claves de Cloudera SDX es un catálogo de datos compartidos con el que es posible maximizar la seguridad, el control y la gestión de funciones, de cara a aplicaciones de análisis transitorios y a largo plazo. El catálogo compartido también permite un acceso por el propio usuario a datos del negocio, ya que esta tecnología no requiere recrear el contexto y los controles en cada nuevo caso.

Cloudera SDX aborda los siguientes retos de los negocios:

Refinerías de datos. Los clústers en la nube no comparten sus datos o metadatos de forma natural, lo que los convierte en silos individuales. En cambio, al compartir de forma persistente estos datos y metadatos, a través de aplicaciones según demanda y clusters en transición, los usuarios de Cloudera tienen más agilidad y se aseguran de que cada clúster aislado no requiere de un control y una gestión individuales, y que tampoco incurre en costes adicionales al tener que copiar y almacenar datos por duplicado.

Brechas de seguridad. Si no existe un control de seguridad centralizado, los administradores se ven obligados a aplicar continuamente políticas de acceso y seguridad, por haber múltiples copias de datos almacenados, lo que crea trabajo extra y un mayor riesgo de exponer información sensible. Con Cloudera SDX, la seguridad se aplica de forma constante a los datos. La política de seguridad penetra en todas las capas y no necesita cambiarse o volver a gestionarse cuando el dato se traslada, o se utiliza con una nueva aplicación para análisis.

Retos de administración e incumplimiento. El catálogo de datos y metadatos compartidos es imperativo a la hora de tratar con el cumplimiento HIPAA (Ley de Responsabilidad y Transferibilidad de Seguros Médicos) y PCI-DSS (Estándar de Seguridad de Datos para la Industria de Tarjeta de Pago), así como con requisitos inminentes como el GDPR. Un catálogo de datos compartidos hace más sencillo encontrar y comprender el contexto de la información, al permitir aplicaciones para el usuario y ofrecer funcionalidades de auditoría inviolables.

Cloudera 5.13 incluye capacidades mejoradas para entornos cloud:

Catálogo multiclúster. Un metastore en colmena que se comparte en Amazon RDS compartido o en MySQL compartido para usuarios de Microsoft Azure, para almacenar y gestionar el contexto de los datos.

Navegador de Cloudera Multiclúster, con capacidades que hacen más sencillo descubrir y administrar el acceso a los datos, con requisitos de auditoría y comprensión.

Permisos y políticas de seguridad Multiclúster Sentry, que proporcionan control de accesos a los datos de forma granular y basados en roles.

– La misma pantalla Cloudera Manager para los clústers desde cualquier lugar, para simplificar las operacionesy mejorar la autenticación de datos.

Backup y recuperación ante pérdidas desde clusters locales a Amazon S3.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

D
Redacción Data Center Market

Artículos relacionados

Artículo 1 de 2