Spark原理深入与编程实战(视频教程)

Ch01 Spark架构与集群搭建

  • Spark简介 观看
  • (2022)Spark简介 观看
  • (2022)Spark技术栈 观看
  • (2022)Spark架构原理 观看
  • (2022)Spark程序部署模式 观看
  • (2022)安装和配置Spark集群 观看
  • (2022)配置和使用Spark历史记录服务器 观看
  • (2022)使用spark-shell进行交互式分析 观看
  • (2022)使用spark-submit提交Spark应用程序 观看

Ch02 开发和部署Spark程序

  • (2022)使用IntelliJ IDEA开发Spark SBT应用程序 观看
  • (2022)使用IntelliJ IDEA开发Spark Maven应用程序 观看
  • (2022)使用Java开发Spark应用程序 观看
  • (2022)使用Zeppelin Notebook进行交互式分析 观看

Ch03 Spark核心编程

  • Spark核心数据抽象RDD 观看
  • Spark RDD单词计数示例 观看
  • 创建和操作RDD 观看
  • aggregate算子详解 观看
  • Spark Pair RDD 观看
  • RDD上的描述性统计操作 观看
  • RDD持久化操作 观看
  • RDD数据重分区 观看
  • Spark程序执行原理 观看
  • 广播变量和累加器 观看
  • (2022)理解核心数据抽象RDD 观看
  • (2022)掌握RDD编程模型 观看
  • (2022)创建RDD的三种方法 观看
  • (2022)RDD上的Transformation和Action操作 观看
  • (2022)数值型RDD上的描述性统计操作方法 观看
  • (2022)键值对RDD上的专用操作方法 观看
  • (2022)持久化RDD 观看
  • (2022)RDD数据分区和数据重分区 观看
  • (2022)自定义数据分区器 观看
  • (2022)基于分区的操作函数 观看
  • (2022)深入理解RDD的执行过程 观看
  • (2022)Spark资源管理 观看
  • (2022)使用共享变量_广播变量和累加器 观看
  • (2022)RDD编程案例_合并小文件 观看
  • (2022)RDD编程案例_实现二次排序 观看
  • (2022)RDD编程案例_Top N实现 观看
  • (2022)RDD编程案例_酒店数据预处理 观看

Ch04 Spark SQL编程

  • Spark SQL数据抽象DataFrame 观看
  • 加载各种数据源构造DataFrame 观看
  • 操作DataFrame 观看
  • 临时表与SQL查询 观看
  • Spark SQL模块详解 观看
  • 使用IntelliJ IDEA开发_Spark SQL项目创建与编程模型 观看
  • 使用IntelliJ IDEA开发_创建DataFrame的方法 观看
  • 使用IntelliJ IDEA开发_SparkSQL内置数据源 观看
  • 使用IntelliJ IDEA开发_对DataFrame执行transformation和action操作 观看
  • 使用IntelliJ IDEA开发_DataFrame上的描述性统计操作 观看
  • 使用IntelliJ IDEA开发_将DataFrame保存到文件或数据库中 观看
  • 使用IntelliJ IDEA开发_使用强类型的Dataset 观看
  • 使用IntelliJ IDEA开发_临时表和使用SQL语句 观看
  • (2022)Spark SQL数据抽象 观看
  • (2022)Spark SQL编程模型 观看
  • (2022)Spark SQL中的数据类型_列对象和行对象 观看
  • (2022)创建DataFrame 观看
  • (2022)操作DataFrame 观看
  • (2022)DataFrame上的描述性数据分析函数 观看
  • (2022)取DataFrame中特定字段的值 观看
  • (2022)存储DataFrame 观看
  • (2022)DataFrame分区存储 观看
  • (2022)使用类型化的Dataset 观看
  • (2022)使用临时视图与SQL查询 观看
  • (2022)缓存DataFrame 观看

Ch05 Spark SQL编程(高级)

  • Spark SQL内置函数 观看
  • 用户定义函数UDF 观看
  • DataFrame的join连接操作 观看
  • 将分析结果存储到文件或数据库中 观看
  • Spark SQL示例_分析银行客户数据 观看
  • 使用IntelliJ IDEA开发_Spark SQL内置日期和时间处理函数 观看
  • 使用IntelliJ IDEA开发_Spark SQL内置字符串函数和数学函数 观看
  • 使用IntelliJ IDEA开发_Spark SQL内置聚合函数 观看
  • 使用IntelliJ IDEA开发_Spark SQL窗口分析函数和时间窗口函数 观看
  • 使用IntelliJ IDEA开发_Spark SQL用户自定义函数UDF 观看
  • 使用IntelliJ IDEA开发_Spark SQL业务分析案例_订单数据集分析 观看
  • 使用IntelliJ IDEA开发_Spark SQL低层_Catalyst优化器和Tungsten 观看
  • (2022)日期时间处理函数 观看
  • (2022)字符串和数学处理函数 观看
  • (2022)集合元素处理函数 观看
  • (2022)其他函数和函数应用示例 观看
  • (2022)Spark3数组函数 观看
  • (2022)聚合和数据透视函数 观看
  • (2022)高级分析函数 观看
  • (2022)用户自定义函数UDF 观看
  • (2022)DataFrame的JOIN连接 观看
  • (2022)Spark SQL读写Hive表 观看
  • (2022)查询优化器Catalyst 观看
  • (2022)Tungsten项目 观看

Ch07 Spark结构化流处理

  • Spark新的结构化流编程模型_使用Socket数据源 观看
  • Spark新的结构化流处理手机事件流_使用文件数据源 观看
  • Spark新的结构化流_使用Rate数据源 观看
  • Spark新的结构化流_了解安装和使用Kafka 观看
  • Spark新的结构化流_使用Kafka数据源 观看
  • Spark结构化流DataFrame操作 观看
  • Spark结构化流计算结果写入到Kafka 观看
  • Spark结构化流_Data Sink_foreach和memory 观看
  • Spark结构化流_输出模式_状态查询_触发器 观看
  • (2022)Spark结构化流简介 观看
  • (2022)Spark结构化流编程模型 观看
  • (2022)Spark结构化流_核心概念 观看
  • (2022)Spark结构化流_数据源 观看
  • (2022)Spark结构化流_Kafka数据源 观看
  • (2022)Spark结构化流_转换操作 观看
  • (2022)Spark结构化流_流的JOIN连接 观看
  • (2022)Spark结构化流_流DataSink 观看
  • (2022)Spark结构化流_Kafka接收器 观看
  • (2022)深入研究输出模式 观看
  • (2022)深入研究触发器 观看

ch08 Spark结构化流(高级)

  • Spark结构化流_事件时间与窗口聚合 观看
  • Spark结构化流_水印 观看
  • Spark结构化流案例_IOT流复杂事件模式检测与报警 观看
  • Spark结构化流案例_案例物流公司车辆超速实时检测与告警_1 观看
  • Spark结构化流案例_案例物流公司车辆超速实时检测与告警_2 观看
  • Spark结构化流案例_案例物流公司车辆超速实时检测与告警_3 观看
  • (2022)事件时间与窗口聚合 观看
  • (2022)理解和使用水印 观看
  • (2022)Spark结构化流_任意状态处理 观看
  • (2022)Spark结构化流_数据去重 观看
  • (2022)容错和检查点 观看
  • (2022)Spark结构化流_案例 观看

综合项目实训

  • (2022)Spark大数据分析综合项目 观看