很高兴和各位分享 FLINK 社区上周的发展。上周 FLINK 1.9.0[1]
正式发布了,本次发布的重大更新包括细粒度的恢复机制(FLIP-1)、State 处理 API(FLIP-43)、提供强一致性保证的 stop-with-savepoint(FLIP-43)以及利用 Angular 7.x 重写的 FLINK WebUI 等。此外,本次发布还包括了一系列正在开发中的供用户预览的特性,例如 Blink 的 SQL Query Processor,Hive 的整合,以及新的 Python Table API(FLIP-38)。欢迎大家下载 FLINK 1.9.0 尝试新功能! 同上次 WEEKLY[2]一样,FLINK WEEKLY 分为 USER、DEV 和 NEWS 三个部分,分别关注到用户问题的解答、社区开发的进展和社区的新闻。 [0] https://zhuanlan.zhihu.com/p/79781544 [1] https://flink.apache.org/news/2019/08/22/release-1.9.0.html [2] https://zhuanlan.zhihu.com/p/78753149 @USER [3] build Flink master brach fail due to npm 从源码 build FLINK 项目的时候,有时候会由于 npm 的问题(通常是网络问题)导致 build 速度慢或 build 失败,由于 npm 仅用于 build FLINK 的 WebUI,可以通过向 maven 传递参数 `-Dskip.npm` 来跳过 npm 的过程,减少 build 的时间。 [4] Flink Kafka Connector相关问题 FLINK 和 Kafka 协作时的一致性保证问题,相关的几个 offset 的定义和理解。 [5] flink1.9.0 LOCAL_WEBSERVER 问题 如果要在自己的项目中要使用 FLINK 的 WebUI,需要依赖 `filnk-runtime-web` 项目,大部分 REST 相关功能仅依赖 `flink-runtime` 但是小部分 REST 接口以及 Angular 开发的 WebUI 均依赖于 `flink-runtime-web`。 [6] processing avro data source using DataSet API and output to parquet 如何使用 FLINK 与 avro 和 parquet 协作? [7] Using S3 as a sink (StreamingFileSink) 用户在将 S3 作为 `StreamingFileSink` 连接到 FLINK 之后发现无法从 savepoint 当中恢复作业,这可能与 S3 管理文件的策略有关。 [8] Issue with FilterableTableSource and the logical optimizer rules FilterableTableSource 的使用过程中 CALCITE 引发的作业失败,社区 Committer 提供了一种 workaround 但是完整的修复还在进行中。 [9] Recovery from job manager crash using check points FLINK 的 job graph store 和 checkpoint store 分别在 JobManager 和 TaskManager 挂掉的情况下提供高可用机制,根据实现的不同可能需要依赖 ZooKeeper 集群来存储元数据。 [10] Can I use watermarkers to have a global trigger of different ProcessFunction's? FLINK 中 watermark 的语义和正确的使用姿势。 [11] Externalized checkpoints External checkpoint 使用过程中 retain 的策略和清理的策略设置。 [12] [SURVEY] How do you use high-availability services in Flink? 基于正在进行的 FLINK 高可用机制重构工作(FLINK-10333),我发起了一个用户使用 FLINK 的高可用机制的调查,欢迎参与到调查中介绍你的使用方式。 [3] https://lists.apache.org/x/thread.html/3d983f5c49b88a316a2e13fdefa10548584c6e841270923033962dc0@%3Cuser-zh.flink.apache.org%3E [4] https://lists.apache.org/x/thread.html/b64e1cd6fc02239589fe3a316293b07ad47ab84f8f62b96b9198b8dc@%3Cuser-zh.flink.apache.org%3E [5] https://lists.apache.org/x/thread.html/2f6e5624079ecb09b18affc18ebf9dce2abba8ecb701657c84043e27@%3Cuser-zh.flink.apache.org%3E [6] https://lists.apache.org/x/thread.html/9349327ab7f130bcaca1b4c3515fcfc6b89b12ac2fac53540cc996df@%3Cuser.flink.apache.org%3E [7] https://lists.apache.org/x/thread.html/a23cb1b0247bb3d9206717bf99c735e11ffe3548fe58fdee8fb96ccc@%3Cuser.flink.apache.org%3E [8] https://lists.apache.org/x/thread.html/69dca869019f39c469907eb23f5dba02696d8fc1fd8ba86d870282e6@%3Cuser.flink.apache.org%3E [9] https://lists.apache.org/x/thread.html/598f3c6d92c316a78e28c8aefb6aa5a00ddea6cdf2dd2c937d635275@%3Cuser.flink.apache.org%3E [10] https://lists.apache.org/x/thread.html/3bebd6e6bb3a11eeb3bc5d5943b7bfce333b737cae3419ebab6490ea@%3Cuser.flink.apache.org%3E [11] https://lists.apache.org/x/thread.html/166f9e21411a1c3b8d749b9b51875f9ff7a1a497debd35603243144a@%3Cuser.flink.apache.org%3E [12] https://lists.apache.org/x/thread.html/c0cc07197e6ba30b45d7709cc9e17d8497e5e3f33de504d58dfcafad@%3Cuser.flink.apache.org%3E @DEV [13] [DISCUSS] FLIP-55: Introduction of a Table API Java Expression DSL Timo Walther 发起了 FLIP-55 的讨论,旨在为 Table API 提供一个 Expression DSL 以方便用户编写程序。 [14] [DISCUSS] FLIP-56: Dynamic Slot Allocation Xintong Song 发起了 FLIP-56 的讨论,旨在提供动态的 Slot 分配策略以更好的利用集群的资源。 [15] [DISCUSS] Upgrade kinesis connector to Apache 2.0 License and include it in official release 更新 Kinesis 连接器的版本使得其 License 为 Apache 2.0 License,此后 FLINK 就可以在发布中直接包含 Kinesis 连接器。 [16] Support disk spilling in HeapKeyedStateBackend Yu Li 提出的 FLIP-50: Spill-able Heap Keyed State Backend <https://cwiki.apache.org/confluence/display/FLINK/FLIP-50%3A+Spill-able+Heap+Keyed+State+Backend> 进入开发阶段。 [17] [DISCUSS] Enhance Support for Multicast Communication Pattern Yun Gao 发起了改进 FLINK 多播通信模式的讨论,这一改进旨在支持算子间更复杂的通信。 [18] CiBot Update Chesnay Schepler 为 FLINK 的 pull request 机器人增加了发送 comment 重新跑测试的功能,这一功能在 ZooKeeper 等社区中也被广泛实现,此后 contributor 不用再通过发送空 commit 或关闭再打开 pull request 来触发重新跑测试。 [19] [DISCUSS] Use Java's Duration instead of Flink's Time Stephan Ewen 发起了使用 Java 8 的 `Duration` 替代 FLINK 的 `Time` 的讨论,此前 FLINK 有两个简单实现的 `Time` 类来表示 runtime 中处理一段时间的概念,这经常引起开发者和用户的困惑。 [13] https://lists.apache.org/x/thread.html/eb5e7b0579e5f1da1e9bf1ab4e4b86dba737946f0261d94d8c30521e@%3Cdev.flink.apache.org%3E ) [14] https://lists.apache.org/x/thread.html/72e5c211fb39ac1c596e12ae096d593ca30118dc12dcf664b7538624@%3Cdev.flink.apache.org%3E [15] https://lists.apache.org/x/thread.html/3876eec7aced42d2ac28728bc5084980ed7bf8ca6a6a8ed56e01e387@%3Cdev.flink.apache.org%3E [16] https://issues.apache.org/jira/browse/FLINK-12692 [17] https://lists.apache.org/x/thread.html/06834937769fda7c7afa4114e4f2f4ec84d95a54cc6ec46a5aa839de@%3Cdev.flink.apache.org%3E [18] https://lists.apache.org/x/thread.html/37c10b3a7e4586d1f704d31cff05021195f1dfc54aabc79a79295079@%3Cdev.flink.apache.org%3E ) [19] https://lists.apache.org/x/thread.html/90ad2f1d7856cfe5bdc8f7dd678c626be96eeaeeb736e98f31660039@%3Cdev.flink.apache.org%3E @NEWS [20] [ANNOUNCE] Apache Flink 1.9.0 released 本周最大的新闻当然是 FLINK 1.9.0 版本发布了。再次复述开头的介绍,本次发布的重大更新包括细粒度的恢复机制(FLIP-1)、State 处理 API(FLIP-43)、提供强一致性保证的 stop-with-savepoint(FLIP-43)以及利用 Angular 7.x 重写的 FLINK WebUI 等。此外,本次发布还包括了一系列正在开发中的供用户预览的特性,例如 Blink 的 SQL Query Processor,Hive 的整合,以及新的 Python Table API(FLIP-38)。欢迎大家下载 FLINK 1.9.0 尝试新功能! [20] https://lists.apache.org/x/thread.html/4a4d23c449f26b66bc58c71cc1a5c6079c79b5049c6c6744224c5f46@%3Cdev.flink.apache.org%3E |
Free forum by Nabble | Edit this page |