07-RDB持久化机制_Hadoop、Spark、Flink、Kafka到Docker、K8s-CSDN在线视频培训

课程开篇
- 从大数据到云原生课程概述
- 【2025版】Redis课程更新概述
- 【2025版】MongoDB课程更新概述
- 【2025版】Docker与K8s课程更新概述
- 【2026版】大数据课程更新概述
- 【2026版】Redis课程更新概述
- 【2026版】MongoDB课程更新感受
- 【2026版】Docker与K8s课程更新概述
【2025版】NoSQL课程更新
- 00-Redis 2025版更新概述
- 01-安装银河麒麟Linux操作系统
- 02-安装部署Redis 7.4
- 03-部署Redis主从复制
- 04-MongoDB 2025版更新概述
- 05-安装银河麒麟Linux操作系统
- 06-安装和使用MongoDB 8.0.4
- 07-部署MongoDB复制集
【2025版】容器课程更新
- 01-Docker与K8s 2025版更新概述
- 02-安装银河麒麟Linux
- 03-使用二进制包方式安装Docker
- 04-安装部署Containerd
- 05-基于Containerd部署K8s集群
（大数据基础-00）大数据技术先导课程
- 01-大数据技术先导课程
（大数据基础-01）大数据技术思想与原理入门
- 01-什么是大数据
- 02-大数据要解决的核心问题
- 03-数据仓库与大数据
- 04-OLTP与OLAP
- 05-分布式文件系统的基本原理
- 06-分布式文件系统中的倒排索引
- 07-分布式文件系统中的机架感知
- 08-MapReduce分布式计算模型
- 09-BigTable大表
- 10-Hadoop生态圈系统
- 11-Spark生态圈系统
- 12-Flink生态圈系统
- 13-大数据平台的整体架构
（大数据基础-02）部署大数据实验环境
- 00-准备大数据平台环境
- 01-Hadoop的目录结构
- 02-部署Hadoop本地模式
- 03-部署Hadoop伪分布模式
- 04-免密码登录的原理和配置
- 05-部署Hadoop全分布模式
- 06-Spark伪分布模式的部署
- 07-Spark全分布模式的部署
- 08-Flink伪分布模式的部署
- 09-Flink全分布模式的部署
- 10-大数据体系架构的单点故障问题
（Hadoop-01）分布式文件系统HDFS
- 01-使用Web Console操作HDFS
- 02-使用命令行操作HDFS
- 03-使用Java API创建目录以及目录的权限问题
- 04-使用Java API完成数据文件的上传和下载
- 05-使用Java API操作HDFS
- 06-主节点NameNode的职责
- 07-从节点DataNode的职责和数据上传的过程
- 08-数据下载的过程
- 09-SecondaryNameNode的职责
- 10-HDFS的高级特性之回收站
- 11-HDFS的高级特性之快照
- 12-HDFS的高级特性之配额管理
- 13-HDFS的高级特性之安全模式
- 14-HDFS的高级特性之权限管理
- 15-基于ViewFS实现HDFS的联盟
- 16-基于ViewFS部署HDFS联盟
- 17-基于RBF实现HDFS的联盟
- 18-基于RBF部署HDFS联盟
- 19-HDFS的底层通信方式：RPC
（Hadoop-02）分布式计算模型MapReduce与Yarn
- 01-分布式计算模型课程简介
- 02-分析WordCount数据处理的过程
- 03-开发自己的WordCount程序
- 04-开发案例-求每个部门的工资总和
- 05-Yarn调度MapReduce任务的过程
- 06-Yarn的资源分配方式
- 07-序列化
- 08-基本数据类型的排序
- 09-对象的排序
- 10-分区的基本知识
- 11-实现MapReduce的自定义分区
- 12-在MapReduce中使用Combiner
- 13-MapReduce的MapJoin
- 14-MapReduce的链式处理
- 15-MapReduce Shuffle洗牌
- 16-数据去重
- 17-等值连接的多表查询数据处理的过程
- 18-使用MapReduce实现等值连接
- 19-自连接的多表查询数据处理的过程
- 20-使用MapReduce实现自连接操作
- 21-分析倒排索引的创建过程
- 22-使用MapReduce实现倒排索引
（Hadoop-03）列式NoSQL数据库HBase
- 01-HBase课程简介
- 02-HBase中的基本概念
- 03-HBase的体系架构
- 04-部署HBase的本地模式
- 05-部署HBase的伪分布模式
- 06-部署HBase的全分布模式和HA模式
- 07-使用命令行工具和Web操作HBase
- 08-使用Java API操作HBase
- 09-HBase上的MapReduce
- 10-使用的HBase过滤器
- 11-HBase写入数据的机制
- 12-HBase读取数据的机制
- 13-HBase的其他运行机制
- 14-HBase多版本Version
- 15-HBase的快照
- 16-HBase的Bulk Loading
- 17-HBase的用户权限管理
- 18-HBase备份与恢复
- 19-HBase的主从复制
- 20-HBase集群监控基础
- 21-利用可视化工具监控HBase
- 22-HBase的预分区
- 23-HBase数据的生命周期
- 24-HBase资源的配额Quota
- 25-Phoenix简介和安装配置
- 26-在Phoenix中使用二级索引
- 27-在Phoenix中执行JDBC
（Hadoop-04）数据分析引擎Hive
- 01-Hive课程简介
- 02-Hive简介
- 03-Hive的体系架构
- 04-部署Hive的嵌入模式
- 05-部署Hive的远程模式
- 06-Hive的内部表
- 07-Hive的外部表
- 08-Hive的静态分区表
- 09-Hive的动态分区表
- 10-Hive的桶表
- 11-Hive的临时表
- 12-Hive的视图
- 13-Hive的字符函数
- 14-Hive的数值函数
- 15-Hive的日期函数
- 16-Hive的条件函数
- 17-Hive的开窗函数
- 18-Hive的URL和JSON解析函数
- 19-开发Hive的用户自定义函数
- 20-开发Hive的用户自定义表生成函数
- 21-Hive的JDBC客户端
- 22-Presto简介与体系架构
- 23-安装部署Presto
- 24-Presto执行查询的过程
（Hadoop-05）分布式协调服务ZooKeeper
- 01-ZooKeeper课程简介
- 02-ZooKeeper集群基础
- 03-部署ZooKeeper的Standalone模式
- 04-部署ZooKeeper的集群模式
- 05-ZooKeeper的节点类型
- 06-ZooKeeper的Watcher机制
- 07-ZooKeeper的分布式锁与秒杀的实现
- 08-基于ZooKeeper实现HDFS的HA架构
- 09-基于ZooKeeper部署Hadoop的HA环境
（Hadoop-06）数据采集引擎Sqoop&Flume
- 01-数据采集课程简介
- 02-使用Apache Sqoop采集数据
- 03-使用Apache Flume采集数据
（Spark-01）离线计算引擎Spark Core
- 01-Spark课程简介
- 02-什么是Spark？
- 03-Spark的体系架构
- 04-使用spark-submit提交Spark任务
- 05-使用spark-shell执行Spark任务
- 06-Spark HA之基于文件系统的单点恢复
- 07-基于ZooKeeper实现Spark的HA
- 08-什么是Spark RDD？
- 09-使用Transformation的基础算子
- 10-使用mapPartitionsWithIndex
- 11-使用aggregate和aggregateByKey
- 12-使用coalesce与repartition算子
- 13-使用Action算子
- 14-RDD的依赖关系和任务执行的阶段
- 15-RDD的检查点机制
- 16-RDD的缓存机制
- 17-开发Scala版本的WordCount程序
- 18-分析Spark WordCount数据处理的过程
- 19-开发Java版本的WordCount程序
- 20-求网站访问量的PV值
- 21-创建自定义分区
- 22-在Spark中访问数据库
（Spark-02）数据分析引擎Spark SQL
- 01-Spark SQL课程简介
- 02-什么是Spark SQL？
- 03-创建DataFrame
- 04-使用DataFrame处理数据
- 05-视图的使用
- 06-使用Parquet文件和JSON文件
- 07-使用JDBC数据源
- 08-使用Hive的表和数据
- 09-优化Spark SQL
- 10-使用StructType指定Schema
- 11-使用样本类指定Schema
- 12-将结果写入MySQL
（Spark-03）流处理引擎Spark Streaming
- 01-Spark Streaming课程简介
- 02-Spark Streaming简介
- 03-运行第一个Spark Streaming任务
- 04-开发第一个自己的Spark Streaming任务
- 05-离散流DStream
- 06-DStream中的转换操作
- 07-窗口操作
- 08-DStream的输入和输出
- 09-集成Spark SQL
- 10-优化Spark Streaming
（Flink01）大数据计算引擎Flink基础
- 01-Flink基础课程概述
- 02-Flink的体系架构
- 03-运行Flink的任务
- 04-Flink on Yarn
- 05-对比Flink、Storm、Spark Streaming
- 06-使用Java开发WordCount批处理计算任务
- 07-使用Java开发WordCount流处理计算任务
- 08-使用Scala开发WordCount批处理计算任务
- 09-使用Scala开发WordCount流处理计算任务
- 10-使用map、flatMap与mapPartition
- 11-使用filter与distinct
- 12-使用First-N
- 13-使用笛卡尔积
- 14-使用Join操作
- 15-使用外连接操作
- 16-使用基本的数据源
- 17-自定义单并行度数据源
- 18-自定义多并行度数据源
- 19-使用union的算子
- 20-使用connect算子
- 21-使用split和connect算子
- 22-使用Redis Sink保存数据
- 23-使用TimeWindow
- 24-使用CountWindow
- 25-Flink的时间
- 26-Watermark水位线机制
- 27-水位线WaterMark编程案例
- 28-Flink HA的架构与部署
（Flink02）大数据计算引擎Flink进阶
- 01-Flink进阶课程概述
- 02-Flink的并行度分析
- 03-使用Flink的分布式缓存
- 04-使用广播变量
- 05-使用累加器与计数器
- 06-Flink的状态管理
- 07-检查点与后端存储
- 08-Flink的重启策略
- 09-使用Table API开发Java版本的批处理WordCount
- 10-使用Table API开发Java版本的流处理WordCount
- 11-使用Table API开发Scala版本的批处理WordCount
- 12-使用Table API开发Scala版本的流处理WordCount
- 13-使用SQL API开发Java版本的批处理WordCount
- 14-使用SQL API开发Java版本的流处理WordCount
- 15-使用SQL API开发Scala版本的批处理WordCount
- 16-使用SQL API开发Scala版本的流处理WordCount
- 17-基于Flink的流批一体架构
大数据消息系统Kafka
- 01-Kafka课程概述
- 02-消息系统概述
- 03-消息系统的分类
- 04-Kafka的体系架构
- 05-主题、分区与副本
- 06-Kafka的生产者
- 07-Kafka的消费者
- 08-部署Kafka单机单Broker模式
- 09-部署Kafka单机多Broker模式
- 10-部署Kafka多机多Broker模式
- 11-使用命令行工具测试Kafka
- 12-Kafka配置参数详解
- 13-Kafka在ZooKeeper中存储的元数据
- 14-开发Java版本的客户端程序
- 15-开发Scala版本的客户端程序
- 16-发布与订阅自定义消息
- 17-消息的持久化
- 18-消息的传输保障
- 19-Leader的选举
- 20-Kafka的日志清理
- 21-集成Flume与Kafka
- 22-基于Spark Streaming接收器方式集成Kafka
- 23-基于Spark Streaming直接读取方式
- 24-将Kafka作为Flink的Source Connector
- 25-将Kafka作为Flink的Sink Connector
（Redis-01）架构实战
- 00-Redis课程介绍
- 01-缓存的设计思想
- 02-缓存开发规范
- 03-缓存架构模式
- 04-Redis概述和高性能原理
- 05-Redis的安装和访问
- 06-Redis的监控
- 07-Redis应用场景
（Redis-02）数据结构剖析
- 01-SDS和跳跃表
- 02-压缩列表和整数集合
- 03-字段和快速列表
- 04-Stream
- 05-HyperLogLog和RedisObject
（Redis-03）工作机制剖析
- 01-RedisDB存储结构
- 02-键管理的基本操作
- 03-遍历键
- 04-迁移键
- 05-删除策略
- 06-内存淘汰策略
- 07-RDB持久化机制
- 08-AOF持久化机制
- 09-Redis客户端的创建与关闭
- 10-Redis命令请求的处理过程
- 11-Redis的管道
- 12-服务器启动流程
- 13-文件事件及处理
- 14-时间事件及处理
（Redis-04）高级特性原理
- 01-发布者订阅者模式
- 02-生产者消费者模式
- 03-事务实现机制剖析（1）
- 04-事务实现机制剖析（2）
- 05-慢查询日志剖析
- 06-Lua脚本基础
- 07-准备Lua脚本
- 08-使用Lua脚本完成限流
（Redis-05）集群高可用实战
- 01-主从复制的架构与配置
- 02-主从复制的通信过程
- 03-主从复制的源码分析
- 04-部署Redis的哨兵
- 05-Redis哨兵的主要配置参数
- 06-哨兵工作原理剖析
- 07-什么是Redis Cluster
- 08-数据分布理论与Redis的数据分区
- 09-Redis Cluster的体系架构
- 10-一致性Hash算法
- 11-手动部署Redis Cluster
- 12-使用脚本create-cluster部署RedisCluste
- 13-操作与管理Redis Cluster
- 14-实现Redis Cluster的代理分片
- 15-Codis的体系架构和组件说明
- 16-安装go语言环境
- 17-02-安装部署Codis集群
- 18-基于Codis的主从复制
- 19-基于Codis的数据分布式存储
（Redis-06）企业解决方案剖析
- 01-缓存命中率
- 02-缓存预热
- 03-缓存穿透
- 04-缓存雪崩和缓存击穿
- 05-HotKey和BigKey
- 06-缓存更新策略
- 07-缓存与数据库一致性
- 08-分布式锁
（MongoDB-01）体系结构
- 00-MongoDB课程简介
- 01-MongoDB简介
- 02-MongoDB的体系结构
- 03-MongoDB的Journal日志
（MongoDB-02）安装和管理配置
- 01-安装MongoDB
- 02-MongoDB中使用配置文件
- 03-使用mongoshell
- 04-使用MongoDB Compass
- 05-管理MongoDB的运行
- 06-了解MongoDB的用户认证机制
- 07-启用MongoDB的用户认证机制
- 08-在MongoDB中进行用户管理
- 09-基于角色的访问控制
- 10-MongoDB的审计
（MongoDB-03）数据类型
- 01-ObjectId类型
- 02-日期类型
- 03-数值类型与其他数据类型
（MongoDB-04）基本操作
- 01-MongoDB的文档操作
- 02-执行基本的查询
- 03-查询嵌套的文档
- 04-查询数组的文档
- 05-查询数组中嵌套的文档
- 06-查询空值和缺失的列
- 07-使用游标查询文档
- 08-执行全文检索
- 09-在全文检索中聚合数据
- 10-执行地理空间查询
（MongoDB-05）聚合操作
- 01-使用Pipeline方式聚合数据
- 02-MapReduce原理
- 03-MapReduce案例
- 04-调试Map函数和Reduce函数
（MongoDB-06）存储引擎原理
- 01-WiredTiger存储引擎-01
- 02-WiredTiger存储引擎-02
- 03-WiredTiger存储引擎-03
- 04-WiredTiger存储引擎-04
- 05-MMAPv1存储引擎
- 06-InMemory存储引擎
（MongoDB-07）索引和分析
- 01-MongoDB的索引简介
- 02-单键索引和多键索引
- 03-复合索引
- 04-过期索引-全文索引-地理位置索引
- 05-MongoDB索引分析和索引优化案例
（MongoDB-08）主从复制与主备切换
- 01-MongoDB复制集
- 02-部署MongoDB复制集
- 03-Oplog和数据的同步
- 04-MongoDB的事务
- 05-管理复制集
- 06-添加节点和删除节点-主备切换
- 07-复制集的选举机制
- 08-主从复制与主备切换原理解析
（MongoDB-09）数据分布式存储
- 01-MongoDB分片的架构
- 02-部署MongoDB分片
- 03-查看配置服务器
- 04-MongoDB分布式存储的工作原理
（MongoDB-10）监控和备份
- 01-监控MongoDB的运行
- 02-MongoDB的备份与恢复
（MongoDB-11）数据模型
- 01-MongoDB的数据建模方式
- 02-MongoDB数据文档的验证
- 03-MongoDB的模型设计
- 04-MongoDB综合架构案例
（Docker-01）基础篇
- 01-Docker的基础篇概述
- 02-什么是Docker及其体系架构
- 03-安装和配置Docker实验环境
- 04-什么是Docker镜像
- 05-使用和访问官方的Docker的镜像仓库
- 06-配置和使用阿里云提供的Docker镜像加速器
- 07-管理Docker镜像
- 08-使用docker_commit和Dockerfile
- 09-Dockerfile使用和综合案例
- 10-容器的基本操作
- 11-Docker的日志
- 12-资源管理基础知识Linux CGroup
- 13-Docker对容器使用CPU使用率的管理
- 14-Docker对容器使用的内存管理和限制
- 15-Docker对容器使用I/O的管理和限制
- 16-Docker网络通信的基本原理
- 17-Docker的网络模式
- 18-容器间的通信
- 19-容器访问控制
- 20-Docker的数据卷
- 21-Docker的数据卷容器
- 22-利用数据卷容器来实现数据的迁移
- 23-Docker与数据库
- 24-Docker与nginx
- 25-Docker与PHP
- 26-Docker与Python
- 27-Docker与Jupyter_Notebook
- 28-Docker与TensorFlow
- 29-Docker与OpenStack
- 30-什么是Harbor
- 31-安装和配置Harbor
- 32-配置Docker客户机并验证环境
（Docker-02）高级篇
- 00-Docker高级篇课程概述
- 01-什么是Docker Machine和安装配置
- 02-在远程主机上安装和管理Docker
- 03-使用docker-machine创建基于virtualbox的虚拟容器
- 04-使用docker-machine创建基于vsphere的虚拟容器
- 05-Docker Compose的概述和安装
- 06-通过手动方式部署Web应用
- 07-通过docker-compose方式部署Web应用
- 08-什么是yml文件
- 09-使用Docker-Compose进行服务的在线扩容和缩容
- 10-Swarm的体系架构与安装配置
- 11-在Swarm集群上部署应用
- 12-实现服务的滚动更新
- 13-Swarm集群的数据持久化
- 14-集群的负载均衡的实现
- 15-什么是Jenkins及其安装配置
- 16-使用Jenkins持续部署一个Java程序
- 17-集成Docker与Jenkins
- 18-什么是服务的注册和发现
- 19-服务的注册中心Consul的配置和使用
- 20-实现Docker容器服务的注册和发现
- 21-DockerUI
- 22-Portainer
- 23-Shipyard
（K8s-01）体系架构
- 00-K8s先导课
- 01-K8s简介和特性
- 02-K8s集群的体系架构和组件
- 03-K8s的对象
（K8s-02）部署K8s集群
- 01-部署Kubernetes集群概述
- 02-使用kubeadmin部署Kubernetes集群
- 03-部署Dashboard UI
- 04-使用yum方式部署Kubernetes集群
- 05-使用minikube部署Kubernetes
- 06-在minikube上部署应用程序
- 07-K8s的命令行工具
- 08-在K8s中部署第一个应用程序
（K8s-03）最小可部署对象Pod
- 01-了解什么是Pod及其优点
- 02-Pod的基本使用方法
- 03-Pod的镜像拉取策略
- 04-Pod的资源限制
- 05-Pod中的容器
- 06-Pod的生命周期
- 07-Pod中容器的重启策略
- 08-Pod的健康检查
- 09-Pod的调度策略和创建过程
- 10-Pod的调度约束
- 11-为什么需要配置管理
- 12-创建ConfigMap
- 13-使用ConfigMap
- 14-ConfigMap的动态更新
- 15-创建Secret
- 16-使用Secret
（K8s-04）使用控制器管理Pod
- 01-为什么要使用控制器？
- 02-使用Deployment控制器
- 03-Deployment控制器的状态
- 04-Deployment控制器的清理策略
- 05-应用部署的金丝雀升级
- 06-应用部署蓝绿升级
- 07-应用部署的滚动升级
- 08-Daemonset控制器
- 09-Job控制器
- 10-Job的终止和清理
- 11-CronJob控制器
- 12-StatefulSets控制器
- 13-StatesfulSets使用的注意事项
（K8s-05）通过Service访问Pod
- 01-Service的概念与使用
- 02-Service的多端口设置与集群的DNS服务
- 03-Service的发布类型-NodePort
- 04-Service的发布类型-ClusterIP
- 05-Service的发布类型-LoadBalance和ExternalName
- 06-userspace代理模式和iptables代理模式
- 07-IPVS代理模式
- 08-Ingress是什么？
- 09-Ingress实战
- 10-Ingress的注解
（K8s-06）持久化存储
- 01-持久化存储概述
- 02-节点数据卷
- 03-网络数据卷
- 04-临时数据卷
- 05-什么是持久卷？
- 06-持久卷的回收策略
- 07-持久卷声明
- 08-storageClass与实现持久卷的动态供给
- 09-实现持久卷的动态供给
（K8s-07）安全认证
- 01-Kubernetes的安全框架
- 02-Kubernetes的用户认证
- 03-Kubernetes的鉴权管理
- 04-基于角色的访问控制简介
- 05-基于角色的访问控制示例
- 06-Kubernetes的其他几种访问控制方式
- 07-服务账号ServiceAccount
- 08-创建和使用服务账号
（K8s-08）日志收集与监控
- 01-收集哪些日志？
- 02-日志收集的架构与方案详解
- 03-安装和配置JDK
- 04-安装和配置ELK
- 05-采集Kubernetes系统组件日志
- 06-采集Nginx Pod访问日志
- 07-采集Tomcat Pod访问日志
- 08-Kubernetes监控系统的架构
- 09-搭建Kubernetes的监控系统
（K8s-09）集成与运维管理
- 01-基于Kubernetes的Jenkins集群架构
- 02-集成Jenkins与Kubernetes
- 03-什么是Helm？
- 04-使用Helm部署应用
- 05-使用Helm创建自己的Charts
课程资料下载
- 课程资料下载
【2026版】大数据数据湖Hudi与Spark
- 大数据2026版更新概述
- 01-Hudi简介
- 02-基于数据湖Hudi的数据平台架构
- 03-编译Hudi
- 04-快速体验Hudi
- 05-集成Hudi与Spark
- 06-使用Spark Shell操作Hudi
- 07-使用Spark SQL操作Hudi
- 08-Hudi Spark Streamer工具简介
- 09-集成Kafka与Hudi Spark Streamer实现数据入湖
【2026版】NoSQL课程更新
- MongoDB 2026版更新概述
- 01-MongoDB时间序列简介
- 02-操作时间序列
- 03-设置时间序列数据的粒度
- 04-时间序列的过期和索引
- Redis 2026版更新概述
- 01-使用基本的SORT命令
- 02-SORT的高级特性
- 03-使用STORE参数保存结果
【2026版】容器课程更新
- 容器 2026版更新概述
- 01-K8s高可用集群规划
- 02-部署非高可用的K8s集群
- 03-部署配置Nginx与Keepalived
- 04-实现Master节点实现高可用
- 05-验证ETCD集群的健康状态
- 06-验证K8s集群的高可用

课时介绍

各位学员大家好现在我们开始学习：07-RDB持久化机制

Hadoop、Spark、Flink、Kafka到Docker、K8s

课时介绍

课程介绍