开发者社区> 问答> 正文

Job-Manager无法恢复Zookeeper检查点

我们在K8s环境中部署了Flink作业集群(1个作业管理器和1个任务管理器),并将其配置为HA模式(连接到Zookeeper)。该作业是有​​状态的,并且使用RocksDB后端启用了检查点。问题是从上一个检查点正确恢复了任务管理器重新启动,但作业管理器重新启动不是:

[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,531 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Recovering checkpoints from ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,596 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Found 0 checkpoints in ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,597 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Trying to fetch 0 checkpoints from storage.
检查点将持久保存到Google Cloud Storage和Zookeeper。

相关性能 flink-conf.yaml:

metrics.reporters: prom
metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter
high-availability: zookeeper
high-availability.zookeeper.quorum: our-k8s-zookeeper-service:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /service_cluster
high-availability.storageDir: gs://our-flink-bucket/namespace/service/ha
high-availability.jobmanager.port: 6123
state.backend.fs.memory-threshold: 0
state.checkpoints.dir: gs://our-flink-bucket/namespace/service/checkpoints

展开
收起
flink小助手 2018-12-11 16:49:08 1923 0
1 条回答
写回答
取消 提交回答
  • flink小助手会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关flink的问题及回答。

    是Flink 1.6.1中的一个错误,升级到1.6.2就可以。

    2019-07-17 23:19:54
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载