Hi Jeff,
对于 SQL,现在只能设置整个 SQL 的并发,不能单独提高某个算子的并发。
不过可以考虑把消费 Kafka 的部分用 DataStream 来实现,然后再把 DataStream 转成 Table 去跑 SQL。这样消费
Kafka 的并发和 SQL 的并发就可以分开来设置了。
还有一个想法是如果你的 Kafka Source 到 UDF 之间有 hash (比如 Group By)之类的重分发的逻辑,是否可以忽略 Kafka
的分区数直接提高整个的并发?这样重分发后面的算子都是有效并发,只有重分发之前会有一些无效实例,不过这个方式不是很推荐,低版本可能会有算子状态变成
finished 影响 Checkpoint 制作。
Smile
--
Sent from:
http://apache-flink.147419.n8.nabble.com/