ClickHouse集成Spark的几种方式
目前,Spark本身尚未对ClickHouse提供完善友好的支持。如果我们要使用Spark读写ClickHouse的话,可以使用ClickHouse官方提供的JDBC驱动实现,也可以使用第三方的JDBC驱动实现。
- 准备ClickHouse测试数据。
- 在Spark中使用ClickHouse官方提供的JDBC驱动。
- 在Spark中使用第三方housepower提供的JDBC驱动。
- 在Spark中使用第三方Clickhouse4j提供的JDBC驱动。
准备ClickHouse测试数据
创建一个名为test的数据库,并在该数据库中创建一个名为visit的表,用于跟踪网站访问时长。
1)先运行以下命令,启动一个客户端会话:
$ clickhouse-client --multiline
2)通过执行以下命令创建test数据库:
xueai8 :) CREATE DATABASE test;
3)确认要使用的数据库test:
xueai8 :) USE test;
4)运行下面这个命令创建visits表:
xue ............
抱歉,只有登录会员才可浏览!会员登录