视频名称

RDD编程模型

视频内容

视频简介

【PySpark原理深入与实战】配套精讲视频
在Spark/PySpark中,使用RDD对数据进行处理,通常遵循如下的模型:

  • (1) 首先,将待处理的数据构造为RDD。
  • (2) 对RDD进行一系列操作,包括Transformation和Action两种类型操作。
  • (3) 最后,输出或保存计算结果。