关于RichReduceFunction和RichAggregateFunction

classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

关于RichReduceFunction和RichAggregateFunction

BenChen


Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制

Reply | Threaded
Open this post in threaded view
|

回复:关于RichReduceFunction和RichAggregateFunction

Yichao Yang
Hi


第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。


Best,
Yichao Yang




------------------ 原始邮件 ------------------
发件人:&nbsp;"BenChen"<[hidden email]&gt;;
发送时间:&nbsp;2020年6月30日(星期二) 下午3:27
收件人:&nbsp;"[hidden email]"<[hidden email]&gt;;

主题:&nbsp;关于RichReduceFunction和RichAggregateFunction





Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制
Reply | Threaded
Open this post in threaded view
|

回复:关于RichReduceFunction和RichAggregateFunction

BenChen
感谢回复。


假设使用uid keyby保证数据流到同一个算子,因为reduce和aggregate无法使用state,那BloomFilter只能放到WindowFunction里面去state了(或者直接使用process),这样逻辑处理就等到窗口触发才执行,影响吞吐量了。


| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制


在2020年06月30日 15:55,Yichao Yang<[hidden email]> 写道:
Hi


第三个问题可以不用使用全局state,我们的做法是将uid keyby,保证相同的用户始终只会被分发到同一个算子的BloomFilter中,这样就可以利用并发解决这个问题。


Best,
Yichao Yang




------------------&nbsp;原始邮件&nbsp;------------------
发件人:&nbsp;"BenChen"<[hidden email]&gt;;
发送时间:&nbsp;2020年6月30日(星期二) 下午3:27
收件人:&nbsp;"[hidden email]"<[hidden email]&gt;;

主题:&nbsp;关于RichReduceFunction和RichAggregateFunction





Hi all,
在flink里面尝试使用RichReduceFunction和RichAggregateFunction,但是收到了UnsupportedOperationException。


看了下源代码,在reduce和aggregate方法里面会检测到是RichFunction的话就会直接抛异常。同时ReduceFunction和AggregateFunction是作为ReducingState和AggregatingState的属性,作为函数的聚合方法,真正让用户使用state是要放到reduce和aggregate对应的WindowFunction参数里面去。


目前我的问题是
1. 是否从Flink设计角度来说,就不支持在reduce和aggregate使用RichFunction?还是说以后会实现?
2. Flink自带的RichReduceFunction和RichAggregateFunction是用在什么场景?
3. 在使用reduce和aggregate聚合的过程中,如果我需要一些全局的state,比如使用BloomFilter判断用户是否参与过这个活动,有什么建议吗?


感谢。
| |
BenChen
|
|
[hidden email]
|
签名由网易邮箱大师定制