视频名称

PySpark SQL内置标量函数

视频内容

您还未登录!(正式会员登录可观看)

会员登录

视频简介

【PySpark原理深入与实战】配套精讲视频
为了帮助执行复杂的分析,PySpark SQL提供了一组强大而灵活的聚合函数、连接多个数据集的函数、一组内置的高性能函数和一组高级分析函数。为了有效地使用PySpark SQL执行分布式数据操作,必须熟练使用PySpark SQL函数。
PySpark SQL提供了大量的标量函数,主要完成:

  • (1) 数学计算:例如abs()、hypot()、log()、cbrt(),等等。
  • (2) 字符串操作:例如length()、trim()、concat(),等等。
  • (3) 日期操作:例如year()、date_add(),等等。