在做实时数仓的时候,有需求要使用flink sql实现全局的row_number(),请教下各位有啥方案吗?
目前想的是,将流进行row
number处理后存储到hbase中,然后每次处理流数据都和hbase进行关联,row_number处理后将最新结果存入hbase中,即通过对hbase的实时读写实现全局row_number().
请问以上方法可行不,,实时读hbase关联,然后在写入最新数据到hbase,效率会有问题吗,这样能满足实时的需求吗?
--
Sent from:
http://apache-flink.147419.n8.nabble.com/