视频课程:PySpark原理深入与编程实战
视频标题: PySpark SQL模式和对象
发布时间:2025-11-27
视频描述
【PySpark原理深入与实战】配套精讲视频
PySpark中的模式(Schema)为一个DataFrame定义了列名和关联数据类型。当想从数据源读取大文件时,最好是预先定义模式。
在PySpark SQL中,列由Column类型表示。DataFrame中的Column对象不能单独存在;每一列都是记录(record)中一行的一部分,所有的行一起构成一个DataFrame。PySpark中的行是一个通用的Row对象,包含一个或多个列。
课程章节 返回课程首页
-
Ch01 Spark架构与集群搭建
-
Ch02 开发和部署PySpark程序
-
Ch03 PySpark核心编程
-
Ch04 PySpark SQL编程(初级)
-
Ch05 PySpark SQL编程(高级)
-
Ch06 PySpark结构化流处理(初级)
-
Ch07 PySpark结构化流处理(高级)
-
ch08 PySpark大数据分析综合案例