投稿 评论
爱收集资源网

快手OLAP平台建设与实践:李远策在ArchSummit全球架构师峰会分享

爱收集资源网 2025-02-11 16:16

今年,数字化潮流席卷而来,企业处理数据时遇到了不少难题。然而,快手采用了Druid OLAP分析引擎和Superset数据可视化平台,为业务拓展找到了新途径。那么,这些工具究竟是如何助力企业发展的?我们一起来揭开这个谜团。

平台上线与升级

今年四月,快手推出了Druid OLAP分析引擎,并与Superset数据可视化平台相融合,这一举措迅速解决了许多业务难题。进入五月,Druid平台同步跟进社区发展,迅速升级至0.12版本。在升级过程中,团队成功解决了时区和文件加载性能等难题,为平台的后续高效运行打下了坚实基础。

A/B Test 指标分析需求

快手业务平台_快手业务平台_快手业务平台

A/B测试的指标分析至关重要,它是一个涉及多个维度的分析流程。在快手,我们的OLAP平台每天需要处理数十万次查询请求。业务部门对查询速度的要求非常高,必须确保查询延迟在百毫秒以内。这样的高要求对平台构成了重大挑战,同时也迫切需要我们进行优化。

查询性能技术支撑

Druid的查询速度非常出色,这主要归功于五大关键技术的支持。当数据进入Druid系统,会按照特定的时间段进行预聚合处理,从而快速生成所需计算的指标和索引信息。此外,列式存储、Bitmap索引、mmap以及查询结果的缓存等技术,也在不同层面提高了查询速度,确保了在高并发环境下平台的稳定运行。

平台架构与数据接入

在快手OLAP的架构里,Druid组件扮演着关键角色。平台接收数据有两种途径,实时数据是通过kafka系统摄取的,而离线数据则是从Hive数仓批量导入的。这样的多源数据接入模式,让企业能够全面管理数据,同时也在一定程度上增强了平台的实用性和适应性。

元数据存储性能优化

快手业务平台_快手业务平台_快手业务平台

平台上线后,我们积累了约几百万个 Segment 文件,导致对 MySQL Segments 表的查询速度变慢。为了克服这一难题,我们团队采用了并行处理方法,通过提交 Hadoop 任务,在 Hadoop 集群中对 Segment 信息进行并行扫描和压缩。经过一番优化,元数据系统的性能得到了大幅提高,性能瓶颈问题基本得到解决。

数据源管理与监控机制

用户需要调整数据源中的维度和指标定义。数据源管理系统,作为一款Web管理工具,支持用户接入、查看及管理数据源,用户可以查看维度、指标信息以及Kafka消费速率等数据。在Indexing task的详细页面,用户可以查看Kafka消费速率等信息,便于问题排查。探针系统对数据源查询热度进行排名,便于管理员集中关注。此外,借鉴Grafana,我们在Superset上实现了报警功能。

在实际的业务操作中,大家认为还有哪些细节可以改进 Druid OLAP 分析引擎和 Superset 平台的功能?若您觉得这篇文章对您有所帮助,不妨点个赞,或者分享给更多人!

快手业务平台
Loading...