教程涵盖Apache生态系统的所有主流技术:Hadoop、Hive、Spark、Flume、Kafka、Azkaban、Zookeeper、Sqoop、Atlas、Kylin、Presto、Kerberos、Ranger、Zabbix等,均采用了最新稳定版。数据治理内容更加全面,搭建Kerberos+Ranger的一体化权限管理系统,使用Python+Shell脚本实现自动化数据质量监控,使用Zabbix+Grafana实现集群性能监控,采用目前企业主流的元数据管理应用Atlas实现了数据血缘管理,保障了数仓的安全性、一致性和可靠性。
学习地址
百度:https://pan.baidu.com/s/1gFzpKNwXG4e_31_hbV-aFQ
天翼:https://cloud.189.cn/t/7BrA326bIrq2
阿里:https://www.aliyundrive.com/s/7fcxoDFTDwo