视频名称

PySpark SQL模式和对象

视频内容

您还未登录!(正式会员登录可观看)

会员登录

视频简介

【PySpark原理深入与实战】配套精讲视频
PySpark中的模式(Schema)为一个DataFrame定义了列名和关联数据类型。当想从数据源读取大文件时,最好是预先定义模式。
在PySpark SQL中,列由Column类型表示。DataFrame中的Column对象不能单独存在;每一列都是记录(record)中一行的一部分,所有的行一起构成一个DataFrame。PySpark中的行是一个通用的Row对象,包含一个或多个列。