视频名称

(2022)Spark SQL数据抽象

视频内容

您还未登录!(正式会员登录可观看)

会员登录

视频简介

Spark SQL的主要数据抽象是Dataset,它表示结构化数据(具有已知模式的记录)。这种结构化数据表示Dataset支持使用存储在JVM堆外的托管对象中的压缩柱状格式的紧凑二进制表示。它可以通过减少内存使用和GC来加快计算速度。