Hi godfrey he,
非常感谢您的回复,我按照相关的文档进行了测试,这个方案确实能够去掉重复的数据。不过,这个方案的状态实在是太大了。我们每秒是 GB 级别的数据,我就按照20分钟的量来设置 TTL 我的状态将会达到 TB 级别,这个比较难以维护。
我想,携带状态的 ScalarFunction 也是一个比较奇怪的需求,不过,在这个场景下面,如果 ScalarFunction 能够访问状态,那么我就不需要使用 ScalarFunction 去访问 redis 或者 hbase 这样的 kv 系统,能够减少开发者的代码,同时大大的提升系统的稳定性。
Best, forideal
在 2020-08-19 10:06:46,"godfrey he" <
[hidden email]> 写道: