图分析示例:简单航班数据分析

本节通过一个简单的示例,分析3个航线信息,每条航线中所有列信息见下表。

用网络图表示的话,如下图所示。

在构建的图模型中,将机场表示为顶点,航线表示为边。图中有三个顶点,每个顶点代表一个机场。每个顶点都有机场代码作为ID,机场所在城市名称作为属性。表示机场的顶点见下表。

边具有源ID、目标ID和作为属性的距离及延误时间。表示航线的边见下表。

接下来使用GraphFrames进行分析。请按以下步骤操作。

(1) 首先,导入相关的依赖包,代码如下:

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._
import org.graphframes.GraphFrame
......

抱歉,只有登录会员才可浏览!会员登录


《PySpark原理深入与编程实战》