Flink CLI常用命令

Flink以CLI的方式提供了一些常见的操作任务。下面是常用的CLI命令。

1、查看正在运行的作业

CLi方式:

$ flink list

注:也可用REST API方式查看正在运行的作业:

$ curl localhost:8081/jobs

2、运行示例程序,不带参数:

$ ./bin/flink run ./examples/batch/WordCount.jar

3、运行示例程序,带有input和output参数:

$ ./bin/flink run ./examples/batch/WordCount.jar \
--input file:///home/user/hamlet.txt \
--output file:///home/user/wordcount_out

4、运行示例程序,带有input和output参数,并指定并行度为16:

$ ./bin/flink run -p 16 ./examples/batch/WordCount.jar \
--input file:///home/user/hamlet.txt \
--output file:///home/user/wordcount_out

5、运行示例程序,禁用flink日志输出:

$ ./bin/flink run -q ./examples/batch/WordCount.jar

6、运行示例程序,在分离模式(detached mode)下:

$ ./bin/flink run -d ./examples/batch/WordCount.jar

7、运行示例程序,在特定的JobManager上:

$ ./bin/flink run -m myJMHost:8081 ./examples/batch/WordCount.jar \
--input file:///home/user/hamlet.txt \
--output file:///home/user/wordcount_out

8、运行示例程序,以特定的类作为入口点:

$ ./bin/flink run -c org.apache.flink.examples.java.wordcount.WordCount ./examples/batch/WordCount.jar \
--input file:///home/user/hamlet.txt \
--output file:///home/user/wordcount_out

9、运行示例程序,使用带有两个TaskManager的一个per-job YARN集群:

$ ./bin/flink run -m yarn-cluster -yn 2 ./examples/batch/WordCount.jar \
--input hdfs:///user/hamlet.txt \
--output hdfs:///user/wordcount_out

10、以JSON格式显示WordCount示例程序的优化执行计划:

$ ./bin/flink info ./examples/batch/WordCount.jar \
--input file:///home/user/hamlet.txt \
--output file:///home/user/wordcount_out

11、列出已调度和正在运行的作业 (包括它们的JobIDs):

$ ./bin/flink list

12、列出已调度的作业 (包括它们的JobIDs):

$ ./bin/flink list -s

13、列出正在运行的作业 (包括它们的JobIDs):

$ ./bin/flink list -r

14、列出所有现有的作业(包括它们的JobIDs):

$ ./bin/flink list -a

15、列出在Flink YARN session内正在运行的Flink作业:

$ ./bin/flink list -m yarn-cluster -yid  -r

16、取消一个作业:

$ ./bin/flink cancel 

17、取消一个作业,带有savepoint:

$ ./bin/flink cancel -s [targetDirectory] 

18、停止一个作业 (仅限于流作业):

$ ./bin/flink stop 

19、修改一个正在运行的作业 (仅限于流作业):

$ ./bin/flink modify  -p 

《PySpark原理深入与编程实战》