视频名称

PySpark SQL数据抽象

视频内容

视频简介

【PySpark原理深入与实战】配套精讲视频
PySpark SQL是PySpark用于处理结构化和半结构化数据的接口,允许使用关系操作符表示分布式内存计算。通过PySpark SQL,用户可以使用熟悉的SQL或DataFrame API查询PySpark程序中的结构化数据。PySpark SQL的主要数据抽象是DataFrame,它表示结构化数据(具有已知模式的记录)。