感谢回复。
假设使用uid keyby保证数据流到同一个算子,因为reduce和aggregate无法使用state,那BloomFilter只能放到WindowFunction里面去state了(或者直接使用process),这样逻辑处理就等到窗口触发才执行,影响吞吐量了。
| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制
在2020年06月30日 15:55,Yichao Yang<
[hidden email]> 写道:
Hi
第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。
Best,
Yichao Yang
------------------ 原始邮件 ------------------
发件人: "BenChen"<
[hidden email]>;
发送时间: 2020年6月30日(星期二) 下午3:27
收件人: "
[hidden email]"<
[hidden email]>;
主题: 关于RichReduceFunction和RichAggregateFunction
Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。
看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。
目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?
感谢。
| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制