|
Hi All,
我们的环境是用marathon 将flink 1.9.1部署在mesos 上,目前存在这样的问题。
在新部署的flink 集群上提交第一个job,能够正常运行起来,但是再提交第二个job,会由于无法获取足够的资源一直重启,并且不再向mesos
申请offer。只有将JM重启,才会触发ResourceManager 向mesos 申请资源后正常运行。
之前在flink 1.7.2版本并没有这个问题,从现象和日志上看,是只有第一次集群部署好后提交Job,才会向mesos
获取offer启动TM,请问各位有什么解决思路?
|