Hi:
interval join可以缓解key值过多问题么?
interval join不也是计算某段时间范围内的join么,跟regular join相比,如何做到避免某个stream的key过多问题?
谢谢.
------------------ 原始邮件 ------------------
发件人: "user-zh" <
[hidden email]>;
发送时间: 2020年7月6日(星期一) 中午11:12
收件人: "user-zh"<
[hidden email]>;
主题: Re: 【Flink Join内存问题】
regular join确实是这样,所以量大的话可以用interval join 、temporal join
> 2020年7月5日 下午3:50,忝忝向仧 <
[hidden email]> 写道:
>
> Hi,all:
>
> 我看源码里写到JoinedStreams:
> 也就是说join时候都是走内存计算的,那么如果某个stream的key值过多,会导致oom
> 那么有什么预防措施呢?
> 将key值多的一边进行打散?
>
>
> Right now, the join is being evaluated in memory so you need to ensure that the number
> * of elements per key does not get too high. Otherwise the JVM might crash.