视频课程:PySpark原理深入与编程实战
视频标题: PySpark结构化流简介
发布时间:2025-11-27
视频描述
【PySpark原理深入与实战】配套精讲视频
Spark在2.0版本中发布了新的流计算的API,结构化流(Structured Streaming)。结构化流提供了快速、可扩展、容错、端到端的精确一次性流处理,而用户无需对流进行推理。结构化流操作直接工作在DataFrame上。不再有“流”的概念,只有流式DataFrame和普通DataFrame。流式DataFrame是作为append-only表实现的。在流数据上的查询返回新的DataFrame,使用它们就像在批处理程序中一样使用。
课程章节 返回课程首页
-
Ch01 Spark架构与集群搭建
-
Ch02 开发和部署PySpark程序
-
Ch03 PySpark核心编程
-
Ch04 PySpark SQL编程(初级)
-
Ch05 PySpark SQL编程(高级)
-
Ch06 PySpark结构化流处理(初级)
-
Ch07 PySpark结构化流处理(高级)
-
ch08 PySpark大数据分析综合案例