Hi,
不仅在 hive 中,在 Flink 中也是一样的,两个系统的SQL解析优化框架都是参考了Calcite, hive的SQL解析是自己的,flink的SQL解析和优化都是基于Calcite,
对于null值是否过滤,SQL中 一个 bool表达式(如 a > b) 的返回值 是有三个的,true,false,unknown,unknown 主要出现在有null值得情况下,比如 null > ‘hello’ 的返回值就是unknown, unknown的返回值可以在calcite中配置,Flink 默认的配置是 unknown as mode,就是 null > ‘hello’ 返回false,看你条件是过滤false的话,那么null值就会被过滤掉.
社区之前有个issue[1]在跟进这个问题, 在此之前建议处理 null 时,都用 IS NULL , IS NOT NULL 先做下过滤再做逻辑判断,一般SQL里面也是这样处理的。
祝好,
Leonard Xu
[1]
https://issues.apache.org/jira/browse/FLINK-18164 <
https://issues.apache.org/jira/browse/FLINK-18164>
> 在 2020年6月25日,23:31,忝忝向仧 <
[hidden email]> 写道:
>
> Hi,all:
>
>
> Flink sql 在使用<>或者!=做过滤时候,null也会像在hive里面样被过滤掉么?
> hive里面感觉这有点坑,每次还要小心处理下.
> 谢谢.