视频课程:Spark原理深入与编程实战

视频标题: (2022)Spark SQL数据抽象

发布时间:2025-11-27

视频描述

Spark SQL的主要数据抽象是Dataset,它表示结构化数据(具有已知模式的记录)。这种结构化数据表示Dataset支持使用存储在JVM堆外的托管对象中的压缩柱状格式的紧凑二进制表示。它可以通过减少内存使用和GC来加快计算速度。