「大数据架构」Apache Flink和Apache Spark—比较指南

2020-07-31

1. 目标

在本教程中，我们将讨论Apache Spark和Apache Flink之间的比较。Apache spark和Apache Flink都是用于大规模批处理和流处理的开源平台，为分布式计算提供容错和数据分布。本指南提供了Apache Flink和Apache Spark这两种蓬勃发展的大数据技术在特性方面的明智比较。

2. Apache Flink vs Apache Spark

3.结论

Apache Spark和Flink都是吸引业界关注的下一代大数据工具。两者都提供与Hadoop和NoSQL数据库的本地连接，并且可以处理HDFS数据。两者都是几个大数据问题的好解决方案。但由于其底层架构，Flink比Spark更快。Apache Spark是Apache存储库中最活跃的组件。Spark拥有非常强大的社区支持和大量的贡献者。Spark已经部署在生产环境中。但就流功能而言，Flink要比Spark好得多(因为Spark以微批的形式处理流)，并且对流有本地支持。Spark被认为是大数据的3G，而Flink被认为是大数据的4G。