目前Flink on K8s(包括Standalone on K8s和native
K8s)支持的HA方式只有ZK+HDFS/S3/GFS/OSS的方式,配置就是和Standalone是一致的[1]
因为JobManager使用了deployment,所以失败以后会自动被再次拉起,然后从ZK和外部存储进行恢复
主要是以下这些配置:
high-availability: zookeeper
high-availability.zookeeper.quorum: localhost:2181
high-availability.storageDir: hdfs:///flink/recovery
high-availability.zookeeper.path.root: /flink
restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts: 1000
restart-strategy.fixed-delay.delay: 10 s
不过基于PV+FileSystemHAService[2]以及HDFS/S3/GFS/OSS
+ NativeK8sHAService[3]这两种方案都还在设计和讨论中
[1].
https://ci.apache.org/projects/flink/flink-docs-master/ops/jobmanager_high_availability.html[2].
https://issues.apache.org/jira/browse/FLINK-17598[3].
https://issues.apache.org/jira/browse/FLINK-12884Best,
Yang
旧城以西 <
[hidden email]> 于2020年9月7日周一 下午5:48写道:
> 请教各位大佬,如果通过k8s session 实现flink的ha,如果有实现的了,请提供一下相应配置文件
> 根据官方文档,配置ha需要修改master,那么通过k8s 部署,如何修改master文件