一个main方法启动2个yarn job问题

classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

一个main方法启动2个yarn job问题

air23
你好。我有一个接kafka 写入tidb的任务 为什么会启动2个yarn任务去运行呢?
我是先用datastream 接入kafka。然后转成table sql写入到tidb
2个job name 一个叫Env.execute配置的名字
一个是叫insert 写入tidb的sql语句名字

Reply | Threaded
Open this post in threaded view
|

Re: 一个main方法启动2个yarn job问题

Rui Li
作业代码是怎么写的啊?按说写SQL的话不需要执行Env.execute

On Fri, Aug 28, 2020 at 9:41 AM air23 <[hidden email]> wrote:

> 你好。我有一个接kafka 写入tidb的任务 为什么会启动2个yarn任务去运行呢?
> 我是先用datastream 接入kafka。然后转成table sql写入到tidb
> 2个job name 一个叫Env.execute配置的名字
> 一个是叫insert 写入tidb的sql语句名字
>
>

--
Best regards!
Rui Li
Reply | Threaded
Open this post in threaded view
|

Re: 一个main方法启动2个yarn job问题

tison
应该说 SQL 的 update 会在底层也 call 一次 env.execute

如果你配的是所谓的 detach 模式,是有这种可能的。这个是实现问题,你可以先贴一下代码,然后描述你要的行为,看下可以怎么写

Best,
tison.


Rui Li <[hidden email]> 于2020年8月28日周五 下午9:59写道:

> 作业代码是怎么写的啊?按说写SQL的话不需要执行Env.execute
>
> On Fri, Aug 28, 2020 at 9:41 AM air23 <[hidden email]> wrote:
>
> > 你好。我有一个接kafka 写入tidb的任务 为什么会启动2个yarn任务去运行呢?
> > 我是先用datastream 接入kafka。然后转成table sql写入到tidb
> > 2个job name 一个叫Env.execute配置的名字
> > 一个是叫insert 写入tidb的sql语句名字
> >
> >
>
> --
> Best regards!
> Rui Li
>