#Apache_Iceberg

2025-12-04

StarRocks 4.0: Real-Time Intelligence on Lakehouse

StarRocks 4.0: Real‑Time Intelligence on Lakehouse. Сквозная оптимизация конвейера в реальном времени, 3–15× ускорение JSON, SQL Plan Manager, Decimal256 и поддержка Apache Iceberg для нативной Lakehouse‑аналитики.

habr.com/ru/articles/973110/

#Lakehouse #Apache_Iceberg #аналитика_в_реальном_времени #JSON #SQL_Plan_Manager #starrocks

2025-12-02

Как мы строили хранилище на 70 ПБ данных и не планируем останавливаться

Привет, сегодня я расскажу о том, как наша команда строила платформу обработки и хранения данных для обучения GenAI-моделей в Сбере, и как мы выросли до 70 ПБ сырых данных. Меня зовут Александр, я работаю в Сбере и два года занимался развитием этой платформы.

habr.com/ru/companies/sberbank

#Apache_Spark #apache_iceberg #parquet #s3 #big_data

2025-11-05

Оптимизация производительности запросов: мощный тандем StarRocks и Apache Iceberg

Apache Iceberg — табличный формат для озёр данных с поддержкой ACID, Schema Evolution, Hidden Partition и версионирования, но при больших метаданных и работе через S3 страдает планирование запросов и латентность. В связке со StarRocks мы показываем, как распределённый Job Plan, Manifest Cache, CBO с гистограммами, Data Cache и материализованные представления выводят lakehouse‑аналитику на уровень DWH: снижают накладные расходы на метаданные, ускоряют планы и выполнение, а запись обратно в Iceberg сохраняет единый источник истины. Разбираем архитектуру Iceberg, типовые узкие места и практики оптимизации на StarRocks 3.2–3.3, включая кейс WeChat/Tencent.

habr.com/ru/articles/963410/

#apache_iceberg #starrocks #lakehouse #data_analysis #data_lake #parquet #manifest #materialized_views

【Apache Iceberg】Apache IcebergのブランチとGlue Data QualityでWAPパターンのデータ品質管理をやってみる
dev.classmethod.jp/articles/ap

#dev_classmethod #Apache_Iceberg #AWS #AWS_Glue_Data_Quality #AWS_Glue

[セッションレポート] オープンテーブルフォーマットで実現する、大規模データ分析基盤の構築と運用 #AWSSummit
dev.classmethod.jp/articles/aw

#dev_classmethod #AWS #SageMaker_Lakehouse #Apache_Iceberg

【セッションレポート】 オープンテーブルフォーマットで実現する、大規模データ分析基盤の構築と運用 (AWS-47) #AWSSummit
dev.classmethod.jp/articles/aw

#dev_classmethod #AWS #Apache_Iceberg #Amazon_SageMaker #SageMaker_Lakehouse

Google CloudのIceberg「BigLake tables for Apache Iceberg in BigQuery」を試しつつ気になるトピックを調べてみた
dev.classmethod.jp/articles/go

#dev_classmethod #Google_BigQuery #Google_Cloud_GCP #Apache_Iceberg

【Iceberg】S3汎用バケットとS3 TablesにおけるIcebergパーティション追加設定の違い
dev.classmethod.jp/articles/ic

#dev_classmethod #Apache_Iceberg #Amazon_S3 #S3_Tables #AWS_Glue

[登壇レポート] Storage JAWS & BigData JAWS 共同開催 ~ S3×Icebergが切り拓く、OTF時代の分析基盤 ~ 「S3 Tables を図解でやさしくおさらい~基本から QuickSight 連携まで」 という内容で登壇してきました #storagejaws #bdjaws #jawsug
dev.classmethod.jp/articles/s3

#dev_classmethod #S3_Tables #Apache_Iceberg #AWS #イベント #JAWS_UG

【AWS Glue】Glueジョブでdynamic_frameをソースに利用したらキャストエラーで困った話
dev.classmethod.jp/articles/aw

#dev_classmethod #AWS_Glue #Apache_Spark #PySpark #Apache_Iceberg

【S3 Tables】メンテナンスジョブのファイル圧縮について調べてみよう
dev.classmethod.jp/articles/s3

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

Python Job Supportpythonjobsupport
2025-05-22

Apache Iceberg Deep Dive | Part 1 | Crash Course

Lakehouse ... source

quadexcel.com/wp/apache-iceber

【小ネタ】 Amazon AthenaのMERGE INTOでIcebergテーブルへのソースデータ重複を検証
dev.classmethod.jp/articles/at

#dev_classmethod #Amazon_Athena #Apache_Iceberg

AWS FirehoseでApache Icebergテーブルに配信する際の「一意のキー設定」と「JSONQuery式(JQ式)」の違いについて
dev.classmethod.jp/articles/aw

#dev_classmethod #AWS #Amazon_Data_Firehose #Amazon_S3 #S3_Tables #Apache_Iceberg

S3 Tables 向けの Iceberg REST Catalog API が追加されたので、PyIcebergからアクセスしてみた。
dev.classmethod.jp/articles/ad

#dev_classmethod #S3_Tables #Apache_Iceberg #AWS_Lambda #AWS

【S3 Tables】スナップショット削除の実行タイミングを確認してみた
dev.classmethod.jp/articles/s3

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

【S3 Tables】ローカルのVSCodeからS3 Tables上のIcebergテーブルを触りたい
dev.classmethod.jp/articles/s3

#dev_classmethod #Apache_Iceberg #S3_Tables #Amazon_S3 #Python

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst