Cloudera repousse les limites de l’innovation sur Iceberg avec REST Catalog, qui permet le partage de données zéro-copie et la gestion unifiée des métadonnées.
 
Cloudera Lakehouse Optimizer assure l’optimisation automatisée et la maintenance des tables Apache Iceberg au sein du data lakehouse ouvert de Cloudera
  Cloudera, la seule plateforme de données et d'IA qui intègre l’IA aux données, où qu'elles se trouvent, annonce de nouvelles mises à jour sur sa plateforme, en particulier Cloudera Iceberg REST Catalog et Cloudera Lakehouse Optimizer, qui viennent tous deux renforcer l’engagement de l’entreprise à fournir le meilleur data lakehouse ouvert alimenté par Iceberg. Grâce à ces dernières, Iceberg REST Catalog fournit désormais l’interopérabilité ouverte nécessaire pour partager des données en toute simplicité, tandis que Lakehouse Optimizer permet de veiller à ce que les données soient toujours optimisées et rentables pour tous les moteurs qui y accèdent, le tout sous la gouvernance et la sécurité unifiées de Cloudera. Ces fonctionnalités améliorées ont été dévoilées lors d’EVOLVE25 NYC, l’événement majeur de Cloudera consacré à l’IA et aux données. 
 
Alors que les entreprises cherchent activement à exploiter toute la puissance de l’IA et de l’analyse, elles se heurtent à des obstacles majeurs, tels que des architectures de données complexes, des plateformes silotées et une gouvernance incohérente. Le transfert de données entre les systèmes à des fins d’analyse ou d’entraînement de l’IA a pour effet d’augmenter les coûts, d’introduire des risques de sécurité et de retarder l’obtention d’enseignements. Les entreprises modernes ont besoin de s’appuyer sur des architectures de données ouvertes, sécurisées et interopérables, capables de prendre en charge les données pour l’IA dans n’importe quel environnement, ainsi qu’une analyse multimoteurs sans imposer la duplication des données ou instaurer une dépendance vis-à-vis d’un fournisseur.
 
Cloudera Iceberg REST Catalog : vers une réduction du coût total de possession et une accélération du retour sur investissement
 
Cloudera est à la fois le premier et le seul fournisseur à intégrer Iceberg REST Catalog dans une plateforme de données et d’IA qui couvre l’ensemble du cycle de vie, permettant ainsi un partage sécurisé des données zéro-copie et une gouvernance unifiée dans n’importe quel cloud ou datacenter.
La nouvelle offre de Cloudera résout ces problèmes en intégrant Iceberg REST Catalog dans sa plateforme. Elle permet aux moteurs tiers d’accéder directement aux données gérées par Cloudera, sans les copier, ni les déplacer, et garantit une application cohérente des politiques ainsi qu’une gestion des métadonnées dans les clouds publics, les datacenters et en périphérie. A ce jour, Cloudera est l’unique fournisseur, tous clouds et datacenters confondus, capable d’offrir une sécurité, une gouvernance et une interopérabilité unifiées tout au long du cycle de vie des données, de l’ingestion en temps réel au traitement à grande échelle, en passant par la consommation d’IA et de BI. En développant la puissance d’Apache Iceberg grâce à un accès basé sur REST, Cloudera permet aux entreprises de pérenniser leurs stratégies de données, tout en conservant un haut niveau de contrôle, de visibilité et de respect de la conformité.
Suite à ces mises à jour, tous les clients de Cloudera sur Iceberg bénéficient désormais d’une interopérabilité fluide et sans copie dans l’ensemble de l’écosystème, ce qui leur permet de se connecter aux principaux moteurs d’analyse et d’IA du marché tels que Snowflake, Databricks, AWS Athena, AWS EMS et Salesforce, avec une conformité ACID totale et des politiques d’accès unifiées. Par ailleurs, ils bénéficient également d’une gouvernance de niveau d’entreprise, grâce à une extension des contrôles d’accès granulaires, de la traçabilité et du processus d’audit aux outils tiers via la Shared Data Experience (SDX) de Cloudera, qui garantit une démocratisation sécurisée des données et une conformité à grande échelle. En outre, les clients disposent d’un accès ouvert aux métadonnées, ce qui leur permet de découvrir instantanément les actifs de données existants, sans être enfermés dans des catalogues propriétaires, ce qui a pour effet d’accélérer le développement de l’IA et la Business Intelligence (BI) grâce à une source de vérité cohérente. Enfin, ces améliorations permettent de réduire le coût total de possession (TCO) et d’accélérer le retour sur investissement (ROI) : les clients font état d’une réduction qui peut atteindre jusqu’à 79 % des coûts de stockage des données, tout en améliorant la visibilité dans l’ensemble des secteurs d’activité. Par exemple, un important client international spécialisé dans l’industrie des satellites est parvenu à réaliser de telles économies, tout en renforçant ses pipelines de données d’IA.
 
Cloudera Lakehouse Optimizer : augmenter les performances des requêtes et réduire les coûts de stockage
Cloudera Lakehouse Optimizer est un nouveau service intelligent qui offre une optimisation automatisée et une maintenance des tables Apache Iceberg dans le lakehouse de Cloudera. Ce service propose des optimisations avancées et intelligentes qui dépassent la simple maintenance des tables, notamment des tâches telles que la réécriture des fichiers manifestes et la suppression des fichiers positionnels. En optimisant les tables de manière intelligente, il élimine les tâches manuelles de gestion des données et les coûts opérationnels, permettant ainsi aux clients de se concentrer sur l’extraction d’informations à partir de leurs données. Il s’agit d’une solution ouverte, applicable à tout moteur compatible avec Iceberg sur n’importe quel cloud public, qui offre une observabilité et un contrôle adaptés aux entreprises grâce à une interface utilisateur unique qui facilite la définition et la modification granulaires des politiques. Les politiques peuvent être appliquées à une table spécifique ou à un catalogue entier, et ce service sera le seul de ce type disponible sur site dans une prochaine version. Par ailleurs, des tests de performances internes montrent que ce service est capable d’améliorer jusqu’à 13 fois les performances des requêtes et de réduire les coûts de stockage de 36 %.
 
« Cloudera a été un pionnier dans le secteur du Big Data, et demeure un fournisseur de plateforme leader qui continue d’investir pour permettre aux entreprises de bénéficier d’un format de table ouverte Apache Iceberg prêt à l’emploi », déclare Leo Brunnick, Chief Product Officer, Cloudera. « Cette annonce témoigne de notre engagement à fournir à nos clients la flexibilité et l’évolutivité nécessaires, ainsi que des enseignements sans compromis, dès qu’ils en ont besoin et sur n’importe quel emplacement. Cet engagement est la raison pour laquelle les plus grandes entreprises internationales font confiance à Cloudera pour intégrer l’IA à leurs données, où qu’elles se trouvent. »
 
Cloudera Data Sharing alimenté par Iceberg REST Catalog et Cloudera Lakehouse Optimizer sont désormais disponibles.
 Alors que les entreprises cherchent activement à exploiter toute la puissance de l’IA et de l’analyse, elles se heurtent à des obstacles majeurs, tels que des architectures de données complexes, des plateformes silotées et une gouvernance incohérente. Le transfert de données entre les systèmes à des fins d’analyse ou d’entraînement de l’IA a pour effet d’augmenter les coûts, d’introduire des risques de sécurité et de retarder l’obtention d’enseignements. Les entreprises modernes ont besoin de s’appuyer sur des architectures de données ouvertes, sécurisées et interopérables, capables de prendre en charge les données pour l’IA dans n’importe quel environnement, ainsi qu’une analyse multimoteurs sans imposer la duplication des données ou instaurer une dépendance vis-à-vis d’un fournisseur.
Cloudera Iceberg REST Catalog : vers une réduction du coût total de possession et une accélération du retour sur investissement
Cloudera est à la fois le premier et le seul fournisseur à intégrer Iceberg REST Catalog dans une plateforme de données et d’IA qui couvre l’ensemble du cycle de vie, permettant ainsi un partage sécurisé des données zéro-copie et une gouvernance unifiée dans n’importe quel cloud ou datacenter.
La nouvelle offre de Cloudera résout ces problèmes en intégrant Iceberg REST Catalog dans sa plateforme. Elle permet aux moteurs tiers d’accéder directement aux données gérées par Cloudera, sans les copier, ni les déplacer, et garantit une application cohérente des politiques ainsi qu’une gestion des métadonnées dans les clouds publics, les datacenters et en périphérie. A ce jour, Cloudera est l’unique fournisseur, tous clouds et datacenters confondus, capable d’offrir une sécurité, une gouvernance et une interopérabilité unifiées tout au long du cycle de vie des données, de l’ingestion en temps réel au traitement à grande échelle, en passant par la consommation d’IA et de BI. En développant la puissance d’Apache Iceberg grâce à un accès basé sur REST, Cloudera permet aux entreprises de pérenniser leurs stratégies de données, tout en conservant un haut niveau de contrôle, de visibilité et de respect de la conformité.
Suite à ces mises à jour, tous les clients de Cloudera sur Iceberg bénéficient désormais d’une interopérabilité fluide et sans copie dans l’ensemble de l’écosystème, ce qui leur permet de se connecter aux principaux moteurs d’analyse et d’IA du marché tels que Snowflake, Databricks, AWS Athena, AWS EMS et Salesforce, avec une conformité ACID totale et des politiques d’accès unifiées. Par ailleurs, ils bénéficient également d’une gouvernance de niveau d’entreprise, grâce à une extension des contrôles d’accès granulaires, de la traçabilité et du processus d’audit aux outils tiers via la Shared Data Experience (SDX) de Cloudera, qui garantit une démocratisation sécurisée des données et une conformité à grande échelle. En outre, les clients disposent d’un accès ouvert aux métadonnées, ce qui leur permet de découvrir instantanément les actifs de données existants, sans être enfermés dans des catalogues propriétaires, ce qui a pour effet d’accélérer le développement de l’IA et la Business Intelligence (BI) grâce à une source de vérité cohérente. Enfin, ces améliorations permettent de réduire le coût total de possession (TCO) et d’accélérer le retour sur investissement (ROI) : les clients font état d’une réduction qui peut atteindre jusqu’à 79 % des coûts de stockage des données, tout en améliorant la visibilité dans l’ensemble des secteurs d’activité. Par exemple, un important client international spécialisé dans l’industrie des satellites est parvenu à réaliser de telles économies, tout en renforçant ses pipelines de données d’IA.
Cloudera Lakehouse Optimizer : augmenter les performances des requêtes et réduire les coûts de stockage
Cloudera Lakehouse Optimizer est un nouveau service intelligent qui offre une optimisation automatisée et une maintenance des tables Apache Iceberg dans le lakehouse de Cloudera. Ce service propose des optimisations avancées et intelligentes qui dépassent la simple maintenance des tables, notamment des tâches telles que la réécriture des fichiers manifestes et la suppression des fichiers positionnels. En optimisant les tables de manière intelligente, il élimine les tâches manuelles de gestion des données et les coûts opérationnels, permettant ainsi aux clients de se concentrer sur l’extraction d’informations à partir de leurs données. Il s’agit d’une solution ouverte, applicable à tout moteur compatible avec Iceberg sur n’importe quel cloud public, qui offre une observabilité et un contrôle adaptés aux entreprises grâce à une interface utilisateur unique qui facilite la définition et la modification granulaires des politiques. Les politiques peuvent être appliquées à une table spécifique ou à un catalogue entier, et ce service sera le seul de ce type disponible sur site dans une prochaine version. Par ailleurs, des tests de performances internes montrent que ce service est capable d’améliorer jusqu’à 13 fois les performances des requêtes et de réduire les coûts de stockage de 36 %.
« Cloudera a été un pionnier dans le secteur du Big Data, et demeure un fournisseur de plateforme leader qui continue d’investir pour permettre aux entreprises de bénéficier d’un format de table ouverte Apache Iceberg prêt à l’emploi », déclare Leo Brunnick, Chief Product Officer, Cloudera. « Cette annonce témoigne de notre engagement à fournir à nos clients la flexibilité et l’évolutivité nécessaires, ainsi que des enseignements sans compromis, dès qu’ils en ont besoin et sur n’importe quel emplacement. Cet engagement est la raison pour laquelle les plus grandes entreprises internationales font confiance à Cloudera pour intégrer l’IA à leurs données, où qu’elles se trouvent. »
Cloudera Data Sharing alimenté par Iceberg REST Catalog et Cloudera Lakehouse Optimizer sont désormais disponibles.
