pyflink1.12 定义源表后, 执行表关联的query效率较慢?

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

pyflink1.12 定义源表后, 执行表关联的query效率较慢?

肖越
不知道大家有没有遇到这种情况,请求大佬帮忙分析一下。


我在flink中定义了两张源表,分别对应于 Mysql 数据库中的表格,
表 a 有6934行数据;表 b 有11415574行数据;
在关联操作后,进行常规的SELECT  WHERE等操作,最后查找符合条件的250条数据。
最后是print() 查找结果操作,每次单机执行都会跑10分钟!


相比于,pyflink1.11 的connector read.query()操作慢了好多,
请问pyflink1.12中是什么操作增加了执行时间,是将query这部分操作放到flink执行了么?
是否有其他的改善方式?