flink监控

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

flink监控

阿西
现有集群hadoop-2.8.0, 并且在其中两台节点上有flink客户端包.
提交任务都在其中一台提交任务.per-job
现在要做flink任务监控, 准备使用大家推荐的pushgateway+prometheus+grafana.
flink on yarn使用的logback打印的日志. hadoop没有开启日志聚合.
现在有个问题是:

hadoop的相关日志例如 resourcemanager、nodemanager、datanode以及userlogs目录下的taskmanager日志的异常告警要怎么做呢???
有什么方案吗?



[hidden email]