Cloudera mengumumkan pembaruan penting pada platform datanya di acara EVOLVE25 di New York, dengan fokus pada dua kemampuan utama: Iceberg REST Catalog dan Cloudera Lakehouse Optimizer.
Pembaruan ini dirancang untuk memperkuat interoperabilitas dan menurunkan beban operasional pada arsitektur data lakehouse skala perusahaan.
Integrasi Iceberg REST Catalog memungkinkan mesin pihak ketiga mengakses data yang dikelola Cloudera secara langsung tanpa perlu menyalin atau memindahkan file—sebuah mekanisme yang sering disebut zero-copy data sharing.
Menurut rilis, kemampuan ini dapat menjaga konsistensi metadata dan kebijakan akses di lingkungan cloud, pusat data, maupun edge, sekaligus mengurangi biaya penyimpanan dan risiko terkait duplikasi data.
Cloudera menyebut bahwa akses berbasis REST pada Apache Iceberg ini memudahkan koneksi ke berbagai mesin analitik dan AI populer, termasuk Snowflake, Databricks, AWS Athena, AWS EMR, dan Salesforce.
Meski membuka akses lintas-platform, Cloudera menegaskan fitur enterprise seperti kepatuhan ACID, kontrol akses granular, data lineage, dan audit tetap dipertahankan melalui mekanisme tata kelola platform.
Di sisi lain, Cloudera Lakehouse Optimizer menghadirkan otomatisasi untuk proses optimisasi dan pemeliharaan tabel Apache Iceberg—lebih dari sekadar housekeeping dasar.
Layanan ini mencakup operasi teknis seperti penulisan ulang manifest dan pengelolaan file posisi (position delete) yang berperan penting menjaga kinerja query dan efisiensi penyimpanan. Fitur observability dan antarmuka visual juga memungkinkan penetapan kebijakan secara rinci di tingkat tabel maupun katalog.
Dalam contoh yang disampaikan Cloudera, sejumlah pelanggan dilaporkan mampu memangkas biaya penyimpanan hingga 79% setelah mengadopsi mekanisme berbagi data tanpa salinan.
Selain itu, benchmark internal perusahaan menunjukkan Lakehouse Optimizer dapat meningkatkan performa query hingga 13× dan menurunkan biaya penyimpanan sekitar 36%—angka yang digambarkan sebagai hasil pengujian internal dan yang dapat bervariasi sesuai profil beban kerja dan konfigurasi pelanggan.
Leo Brunnick, Chief Product Officer Cloudera, menegaskan bahwa investasi ini bertujuan menjadikan format tabel Apache Iceberg siap untuk kebutuhan enterprise dengan kombinasi fleksibilitas, visibilitas, dan tata kelola terpadu.
Cloudera menempatkan pembaruan ini sebagai bagian dari strategi untuk menjalankan AI “di mana pun data berada” tanpa mengorbankan kontrol dan kepatuhan.
Cloudera menyatakan bahwa Cloudera Data Sharing yang didukung Iceberg REST Catalog serta Cloudera Lakehouse Optimizer kini tersedia dalam status General Availability (GA).