本地checkpoint 文件190G了

classic Classic list List threaded Threaded
17 messages Options
sun
Reply | Threaded
Open this post in threaded view
|

本地checkpoint 文件190G了

sun
求助,我的文件夹一直在长大

Reply | Threaded
Open this post in threaded view
|

Re:本地checkpoint 文件190G了

Henry

是不是很快就增长到那么多了?





在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:

求助,我的文件夹一直在长大




发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复:本地checkpoint 文件190G了

sun
花了两天时间------------------ 原始邮件 ------------------
发件人: "Henry"<[hidden email]>
发送时间: 2019年11月30日(星期六) 上午10:25
收件人: "user-zh"<[hidden email]>;
主题: Re:本地checkpoint 文件190G了



是不是很快就增长到那么多了?





在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:

求助,我的文件夹一直在长大




发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

Re: 本地checkpoint 文件190G了

tison
你的 retain 数量设置是多少,然后程序里 state 本身写了多大的 state,有没开启 incremental checkpoint

Best,
tison.


sun <[hidden email]> 于2019年11月30日周六 上午10:28写道:

> 花了两天时间------------------ 原始邮件 ------------------
> 发件人: "Henry"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 上午10:25
> 收件人: "user-zh"<[hidden email]>;
> 主题: Re:本地checkpoint 文件190G了
>
>
>
> 是不是很快就增长到那么多了?
>
>
>
>
>
> 在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:
>
> 求助,我的文件夹一直在长大
>
>
>
>
> 发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复: 本地checkpoint 文件190G了

sun
retain 配置的20,还需要在程序里面配置什么吗,increase已经开启了,请问程序要怎么配置 ------------------ 原始邮件 ------------------
发件人: "tison"<[hidden email]>
发送时间: 2019年11月30日(星期六) 上午10:31
收件人: "user-zh"<[hidden email]>;
主题: Re: 本地checkpoint 文件190G了


你的 retain 数量设置是多少,然后程序里 state 本身写了多大的 state,有没开启 incremental checkpoint

Best,
tison.


sun <[hidden email]> 于2019年11月30日周六 上午10:28写道:

> 花了两天时间------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "Henry"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 上午10:25
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: Re:本地checkpoint 文&#x4EF6;190G了
>
>
>
> 是不是很快就增长到那么多了?
>
>
>
>
>
> 在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:
>
> 求助,我的文&#x4EF6;夹一直在长大
>
>
>
>
> 发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

Re: 本地checkpoint 文件190G了

tison
retain 20 干啥...默认是 1 基本也还行,我还没见过其他生产上超过 5 的...

你的 checkpoint interval 是多少(这个不影响最终大小但是可能很快你就看到 checkpoint 文件大小涨上去),然后单次
checkpoint 大小多大知道吗?

听上去像是预期行为因为你配置就是要保留很多的 checkpoint,实际上自动恢复的时候只会读最后一个

Best,
tison.


sun <[hidden email]> 于2019年11月30日周六 上午10:33写道:

> retain 配置的20,还需要在程序里面配置什么吗,increase已经开启了,请问程序要怎么配置 ------------------ 原始邮件
> ------------------
> 发件人: "tison"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 上午10:31
> 收件人: "user-zh"<[hidden email]>;
> 主题: Re: 本地checkpoint 文件190G了
>
>
> 你的 retain 数量设置是多少,然后程序里 state 本身写了多大的 state,有没开启 incremental checkpoint
>
> Best,
> tison.
>
>
> sun <[hidden email]> 于2019年11月30日周六 上午10:28写道:
>
> > 花了两天时间------------------ 原始邮&#x4EF6; ------------------
> > 发&#x4EF6;人: "Henry"<[hidden email]>
> > 发送时间: 2019年11月30日(星期六) 上午10:25
> > 收&#x4EF6;人: "user-zh"<[hidden email]>;
> > 主题: Re:本地checkpoint 文&#x4EF6;190G了
> >
> >
> >
> > 是不是很快就增长到那么多了?
> >
> >
> >
> >
> >
> > 在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:
> >
> > 求助,我的文&#x4EF6;夹一直在长大
> >
> >
> >
> >
> > 发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

Re:回复: 本地checkpoint 文件190G了

Henry
In reply to this post by sun


太多了, 只保留最新的哪个checkpoint或者保留2、3个就好了。






在 2019-11-30 10:33:37,"sun" <[hidden email]> 写道:

>retain 配置的20,还需要在程序里面配置什么吗,increase已经开启了,请问程序要怎么配置 ------------------ 原始邮件 ------------------
>发件人: "tison"<[hidden email]>
>发送时间: 2019年11月30日(星期六) 上午10:31
>收件人: "user-zh"<[hidden email]>;
>主题: Re: 本地checkpoint 文件190G了
>
>
>你的 retain 数量设置是多少,然后程序里 state 本身写了多大的 state,有没开启 incremental checkpoint
>
>Best,
>tison.
>
>
>sun <[hidden email]> 于2019年11月30日周六 上午10:28写道:
>
>> 花了两天时间------------------ 原始邮&#x4EF6; ------------------
>> 发&#x4EF6;人: "Henry"<[hidden email]>
>> 发送时间: 2019年11月30日(星期六) 上午10:25
>> 收&#x4EF6;人: "user-zh"<[hidden email]>;
>> 主题: Re:本地checkpoint 文&#x4EF6;190G了
>>
>>
>>
>> 是不是很快就增长到那么多了?
>>
>>
>>
>>
>>
>> 在 2019-11-30 10:13:27,"sun" <[hidden email]> 写道:
>>
>> 求助,我的文&#x4EF6;夹一直在长大
>>
>>
>>
>>
>> 发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

回复: 本地checkpoint 文件190G了

tangjunliang@huitongjy.com
In reply to this post by sun
用的什么backend? state.backend.incremental  这个参数设置的什么?



[hidden email]
 
发件人: sun
发送时间: 2019-11-30 10:13
收件人: flink; user-zh-subscribe
主题: 本地checkpoint 文件190G了
求助,我的文件夹一直在长大




发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复: 本地checkpoint 文件190G了

sun
rocksdb ,设置的true------------------ 原始邮件 ------------------
发件人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:03
收件人: "user-zh"<[hidden email]>;
主题: 回复: 本地checkpoint 文件190G了


用的什么backend? state.backend.incremental  这个参数设置的什么?



[hidden email]
 
发&#x4EF6;人: sun
发送时间: 2019-11-30 10:13
收&#x4EF6;人: flink; user-zh-subscribe
主题: 本地checkpoint 文&#x4EF6;190G了
求助,我的文&#x4EF6;夹一直在长大




发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

tangjunliang@huitongjy.com
如果处理数据没有达到一定量级,建议state.backend.incremental 设为false



[hidden email]
 
发件人: sun
发送时间: 2019-11-30 14:05
收件人: user-zh
主题: 回复: 本地checkpoint 文件190G了
rocksdb ,设置的true------------------ 原始邮件 ------------------
发件人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:03
收件人: "user-zh"<[hidden email]>;
主题: 回复: 本地checkpoint 文件190G了
 
 
用的什么backend? state.backend.incremental  这个参数设置的什么?
 
 
 
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 10:13
收&#x4EF6;人: flink; user-zh-subscribe
主题: 本地checkpoint 文&#x4EF6;190G了
求助,我的文&#x4EF6;夹一直在长大
 
 
 
 
发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

sun
好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文件,怎么让我的本地checkpoint 不会一直长大------------------ 原始邮件 ------------------
发件人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:06
收件人: "user-zh"<[hidden email]>;
主题: 回复: 回复: 本地checkpoint 文件190G了


如果处理数据没有达到一定量级,建议state.backend.incremental 设为false



[hidden email]
 
发&#x4EF6;人: sun
发送时间: 2019-11-30 14:05
收&#x4EF6;人: user-zh
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
发&#x4EF6;人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:03
收&#x4EF6;人: "user-zh"<[hidden email]>;
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
 
 
用的什么backend? state.backend.incremental  这个参数设置的什么?
 
 
 
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 10:13
收&#x4EF6;人: flink; user-zh-subscribe
主题: 本地checkpoint 文&#x4EF6;190G了
求助,我的文&#x4EF6;夹一直在长大
 
 
 
 
发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

tangjunliang@huitongjy.com
你可以试试state.backend.incremental设置为false,这样你的checkpoint应该不会怎么长大。如果想手动清理,看你的flink版本是否支持TTL



[hidden email]
 
发件人: sun
发送时间: 2019-11-30 14:08
收件人: user-zh
主题: 回复: 回复: 本地checkpoint 文件190G了
好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文件,怎么让我的本地checkpoint 不会一直长大------------------ 原始邮件 ------------------
发件人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:06
收件人: "user-zh"<[hidden email]>;
主题: 回复: 回复: 本地checkpoint 文件190G了
 
 
如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
 
 
 
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 14:05
收&#x4EF6;人: user-zh
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
发&#x4EF6;人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:03
收&#x4EF6;人: "user-zh"<[hidden email]>;
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
用的什么backend? state.backend.incremental  这个参数设置的什么?
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 10:13
收&#x4EF6;人: flink; user-zh-subscribe
主题: 本地checkpoint 文&#x4EF6;190G了
求助,我的文&#x4EF6;夹一直在长大
发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

Re: 回复: 本地checkpoint 文件190G了

tison
In reply to this post by sun
retain 调小是你的场景比较简单的方法,1 2 3 都行,你可以试试...

Best,
tison.


sun <[hidden email]> 于2019年11月30日周六 下午2:08写道:

> 好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文件,怎么让我的本地checkpoint
> 不会一直长大------------------ 原始邮件 ------------------
> 发件人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:06
> 收件人: "user-zh"<[hidden email]>;
> 主题: 回复: 回复: 本地checkpoint 文件190G了
>
>
> 如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
>
>
>
> [hidden email]
>
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 14:05
> 收&#x4EF6;人: user-zh
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
> rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:03
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
>
>
> 用的什么backend? state.backend.incremental  这个参数设置的什么?
>
>
>
> [hidden email]
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 10:13
> 收&#x4EF6;人: flink; user-zh-subscribe
> 主题: 本地checkpoint 文&#x4EF6;190G了
> 求助,我的文&#x4EF6;夹一直在长大
>
>
>
>
> 发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

sun
In reply to this post by tangjunliang@huitongjy.com
感谢,我在生产上试试看------------------ 原始邮件 ------------------
发件人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:11
收件人: "user-zh"<[hidden email]>;
主题: 回复: 回复: 本地checkpoint 文件190G了


你可以试试state.backend.incremental设置为false,这样你的checkpoint应该不会怎么长大。如果想手动清理,看你的flink版本是否支持TTL



[hidden email]
 
发&#x4EF6;人: sun
发送时间: 2019-11-30 14:08
收&#x4EF6;人: user-zh
主题: 回复: 回复: 本地checkpoint 文&#x4EF6;190G了
好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文&#x4EF6;,怎么让我的本地checkpoint 不会一直长大------------------ 原始邮&#x4EF6; ------------------
发&#x4EF6;人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:06
收&#x4EF6;人: "user-zh"<[hidden email]>;
主题: 回复: 回复: 本地checkpoint 文&#x4EF6;190G了
 
 
如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
 
 
 
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 14:05
收&#x4EF6;人: user-zh
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
发&#x4EF6;人: "[hidden email]"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:03
收&#x4EF6;人: "user-zh"<[hidden email]>;
主题: 回复: 本地checkpoint 文&#x4EF6;190G了
用的什么backend? state.backend.incremental  这个参数设置的什么?
[hidden email]
发&#x4EF6;人: sun
发送时间: 2019-11-30 10:13
收&#x4EF6;人: flink; user-zh-subscribe
主题: 本地checkpoint 文&#x4EF6;190G了
求助,我的文&#x4EF6;夹一直在长大
发自我的iPhone
sun
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

sun
In reply to this post by tison
感谢,我这样在生产上试试看------------------ 原始邮件 ------------------
发件人: "tison"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:12
收件人: "user-zh"<[hidden email]>;
主题: Re: 回复: 本地checkpoint 文件190G了


retain 调小是你的场景比较简单的方法,1 2 3 都行,你可以试试...

Best,
tison.


sun <[hidden email]> 于2019年11月30日周六 下午2:08写道:

> 好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文&#x4EF6;,怎么让我的本地checkpoint
> 不会一直长大------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:06
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: 回复: 回复: 本地checkpoint 文&#x4EF6;190G了
>
>
> 如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
>
>
>
> [hidden email]
>
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 14:05
> 收&#x4EF6;人: user-zh
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
> rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:03
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
>
>
> 用的什么backend? state.backend.incremental  这个参数设置的什么?
>
>
>
> [hidden email]
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 10:13
> 收&#x4EF6;人: flink; user-zh-subscribe
> 主题: 本地checkpoint 文&#x4EF6;190G了
> 求助,我的文&#x4EF6;夹一直在长大
>
>
>
>
> 发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

回复: 回复: 本地checkpoint 文件190G了

2421307858@qq.com
hi 你们好,

我想问下这个邮件怎么退订,谢谢



[hidden email]
 
发件人: sun
发送时间: 2019-11-30 14:15
收件人: user-zh
主题: 回复: 回复: 本地checkpoint 文件190G了
感谢,我这样在生产上试试看------------------ 原始邮件 ------------------
发件人: "tison"<[hidden email]>
发送时间: 2019年11月30日(星期六) 下午2:12
收件人: "user-zh"<[hidden email]>;
主题: Re: 回复: 本地checkpoint 文件190G了
 
 
retain 调小是你的场景比较简单的方法,1 2 3 都行,你可以试试...
 
Best,
tison.
 
 
sun <[hidden email]> 于2019年11月30日周六 下午2:08写道:
 

> 好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文&#x4EF6;,怎么让我的本地checkpoint
> 不会一直长大------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:06
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: 回复: 回复: 本地checkpoint 文&#x4EF6;190G了
>
>
> 如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
>
>
>
> [hidden email]
>
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 14:05
> 收&#x4EF6;人: user-zh
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
> rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
> 发&#x4EF6;人: "[hidden email]"<[hidden email]>
> 发送时间: 2019年11月30日(星期六) 下午2:03
> 收&#x4EF6;人: "user-zh"<[hidden email]>;
> 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
>
>
> 用的什么backend? state.backend.incremental  这个参数设置的什么?
>
>
>
> [hidden email]
> 发&#x4EF6;人: sun
> 发送时间: 2019-11-30 10:13
> 收&#x4EF6;人: flink; user-zh-subscribe
> 主题: 本地checkpoint 文&#x4EF6;190G了
> 求助,我的文&#x4EF6;夹一直在长大
>
>
>
>
> 发自我的iPhone
Reply | Threaded
Open this post in threaded view
|

Re: 回复: 回复: 本地checkpoint 文件190G了

Yun Tang
In reply to this post by sun
Hi

为什么你知道本地checkpoint文件达到190GB了,具体是哪个目录撑到了190GB?

如果没有启用 state.backend.local-recovery:
        * 使用FsSateBackend/Memory StateBackend, 本地不应该有什么checkpoint文件残留,因为执行checkpoint时,直接写HDFS了
        * 使用 RocksDB state backend,无论是否开启incremental checkpoint本地也不应该有任何checkpoint文件残留(因为会被及时清理掉),除非你的DB目录本身就达到了190GB

如果启用了 state.backend.local-recovery:
        * 使用Memory StateBackend:与不启用时等效,因为Memory StateBackend不支持local recovery
        * 使用FsStateBackend/RocksDBStateBackend:存有本地checkpoint备份,目前只能等到有一个checkpoint完成才能及时清理无用的文件,需要等 FLINK-8871 fix 才能及时清理本地无用文件

我所能怀疑的就是你的作业长时间checkpoint没有成功,导致本地的local recovery目录不断增大。
另外,retain checkpoint(默认为1)是分布式checkpoint store中保留几个checkpoint的概念,与task manager端本地的checkpoint保留几个无关。

祝好
唐云


On 11/30/19, 2:15 PM, "sun" <[hidden email]> wrote:

    感谢,我这样在生产上试试看------------------ 原始邮件 ------------------
    发件人: "tison"<[hidden email]>
    发送时间: 2019年11月30日(星期六) 下午2:12
    收件人: "user-zh"<[hidden email]>;
    主题: Re: 回复: 本地checkpoint 文件190G了
   
   
    retain 调小是你的场景比较简单的方法,1 2 3 都行,你可以试试...
   
    Best,
    tison.
   
   
    sun <[hidden email]> 于2019年11月30日周六 下午2:08写道:
   
    > 好的,我主要想知道,怎么定时清理那些我用不到的checkpoint 文&#x4EF6;,怎么让我的本地checkpoint
    > 不会一直长大------------------ 原始邮&#x4EF6; ------------------
    > 发&#x4EF6;人: "[hidden email]"<[hidden email]>
    > 发送时间: 2019年11月30日(星期六) 下午2:06
    > 收&#x4EF6;人: "user-zh"<[hidden email]>;
    > 主题: 回复: 回复: 本地checkpoint 文&#x4EF6;190G了
    >
    >
    > 如果处理数据没有达到一定量级,建议state.backend.incremental 设为false
    >
    >
    >
    > [hidden email]
    >
    > 发&#x4EF6;人: sun
    > 发送时间: 2019-11-30 14:05
    > 收&#x4EF6;人: user-zh
    > 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
    > rocksdb ,设置的true------------------ 原始邮&#x4EF6; ------------------
    > 发&#x4EF6;人: "[hidden email]"<[hidden email]>
    > 发送时间: 2019年11月30日(星期六) 下午2:03
    > 收&#x4EF6;人: "user-zh"<[hidden email]>;
    > 主题: 回复: 本地checkpoint 文&#x4EF6;190G了
    >
    >
    > 用的什么backend? state.backend.incremental  这个参数设置的什么?
    >
    >
    >
    > [hidden email]
    > 发&#x4EF6;人: sun
    > 发送时间: 2019-11-30 10:13
    > 收&#x4EF6;人: flink; user-zh-subscribe
    > 主题: 本地checkpoint 文&#x4EF6;190G了
    > 求助,我的文&#x4EF6;夹一直在长大
    >
    >
    >
    >
    > 发自我的iPhone