视频名称

RDD共享变量

视频内容

视频简介

【PySpark原理深入与实战】配套精讲视频
除了RDD,PySpark中还提供了另一个数据抽象“共享变量”。共享变量可以在并行操作中使用。PySpark在其分布式计算环境中提供了两种类型的共享变量:广播变量(broadcast variable)和累加器(accumulator)。