文档详情

Databend(吴炳锡):数据汇聚平台建设及挑战.pdf

发布:2025-04-22约1.29万字共24页下载文档
文本预览下载声明

数据汇聚平台建设及挑战

DtabendLabs吴炳锡

目录

CONTENTS▶数据汇聚平台的背景及挑战

▶新一代湖仓Databend如何应对

▶Databend建设数据汇聚平台整体架构

▶在汇聚平台上构建数据集市

数据汇聚平台的背景及挑战

数据汇聚平台的背景

客户端实时上报接口

Nginx日志Flume/fluentdKafkaflinkMySQL统计库

MySQLMaxwell

a

RedisClickhouse

sqoop

HDFS

业务端AFlume/fluentd/OSS

业务端BMySQL统计库/IceBergHivePresto

Mr+Spark

...Maxwell/Hudi

任务调度补数数据实时数据报表自助查询

任务监控跑批即度查询跑批

数据汇聚平台的背景及挑战

Clickhouse/GreenPlum

ES

Hudi/Icebreg/Paimon

Trino/Implala

各种大模型

数据汇聚平台的背景及挑战

当前的挑战

01海量数据接入,大量数据搬家,数据一致性差05数据加工资源占多,存在严重的性能问题

02技术栈多,组件多,运维成本高

显示全部
相似文档