请教大佬一个我最近在配置Flink流的过程中遇到问题,
flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 |
Hi
现在 checkpoint/savepoint 需要所有算子都处于 RUNNING 状态,不过社区也有一些 issue 希望能够优化这个问题[1][2] [1] https://issues.apache.org/jira/browse/FLINK-2491 [2] https://issues.apache.org/jira/browse/FLINK-18263 Best, Congxian yulu yang <[hidden email]> 于2020年8月13日周四 下午1:49写道: > 请教大佬一个我最近在配置Flink流的过程中遇到问题, > > flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 > |
Hi
不好意思,上一份邮件没有说完就发送出去了。 如果你希望把从其他地方读入 字典表,然后在 flink 中使用,或许可以看看 broadcast state[1] [1] https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/stream/state/broadcast_state.html Best, Congxian Congxian Qiu <[hidden email]> 于2020年8月13日周四 下午2:00写道: > Hi > 现在 checkpoint/savepoint 需要所有算子都处于 RUNNING 状态,不过社区也有一些 issue > 希望能够优化这个问题[1][2] > > [1] https://issues.apache.org/jira/browse/FLINK-2491 > [2] https://issues.apache.org/jira/browse/FLINK-18263 > Best, > Congxian > > > yulu yang <[hidden email]> 于2020年8月13日周四 下午1:49写道: > >> 请教大佬一个我最近在配置Flink流的过程中遇到问题, >> >> flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 >> > |
收到,十分感谢,我学习一下!
Congxian Qiu <[hidden email]> 于2020年8月13日周四 下午2:04写道: > Hi > 不好意思,上一份邮件没有说完就发送出去了。 > 如果你希望把从其他地方读入 字典表,然后在 flink 中使用,或许可以看看 broadcast state[1] > > [1] > > https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/stream/state/broadcast_state.html > Best, > Congxian > > > Congxian Qiu <[hidden email]> 于2020年8月13日周四 下午2:00写道: > > > Hi > > 现在 checkpoint/savepoint 需要所有算子都处于 RUNNING 状态,不过社区也有一些 issue > > 希望能够优化这个问题[1][2] > > > > [1] https://issues.apache.org/jira/browse/FLINK-2491 > > [2] https://issues.apache.org/jira/browse/FLINK-18263 > > Best, > > Congxian > > > > > > yulu yang <[hidden email]> 于2020年8月13日周四 下午1:49写道: > > > >> 请教大佬一个我最近在配置Flink流的过程中遇到问题, > >> > >> > flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 > >> > > > -- 致 礼! 北京理正人信息技术有限公司 综合软件开发部: 杨豫鲁 TEL:13488824529 |
In reply to this post by yulu yang
在我们的生产环境最常用的做法都是通过维表关联的方式进行赋值的;
或者可以先将字典数据写进redis,然后再在第一次使用的时候去访问redis,并加载到State中。 ------------------ 原始邮件 ------------------ 发件人: "user-zh" <[hidden email]>; 发送时间: 2020年8月13日(星期四) 中午1:49 收件人: "user-zh"<[hidden email]>; 主题: 请教关于Flink算子FINISHED状态时无法保存Checkpoint的问题 请教大佬一个我最近在配置Flink流的过程中遇到问题, flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 |
Hi 吴磊
请问你们有比较过使用 Redis 和 broadcast state 在你们场景下的区别吗?是什么原因让你们选择 Redis 而不是 BroadcastState 呢? Best, Congxian 吴磊 <[hidden email]> 于2020年8月14日周五 下午3:39写道: > 在我们的生产环境最常用的做法都是通过维表关联的方式进行赋值的; > 或者可以先将字典数据写进redis,然后再在第一次使用的时候去访问redis,并加载到State中。 > > > > > ------------------ 原始邮件 ------------------ > 发件人: > "user-zh" > < > [hidden email]>; > 发送时间: 2020年8月13日(星期四) 中午1:49 > 收件人: "user-zh"<[hidden email]>; > > 主题: 请教关于Flink算子FINISHED状态时无法保存Checkpoint的问题 > > > > 请教大佬一个我最近在配置Flink流的过程中遇到问题, > > flink作业中关联使用了物理表(字典表),在flinkjob启动后,会对字典表进行一次读取,然后该算子会变成FINISHED状态,导致该flinkjob无法保存checkpoint和savepoint。一般大家遇到这种问题都是怎么处理的,我这个作业在数据加工过程中必须用到字典表赋值。 |
Free forum by Nabble | Edit this page |