1.1Flink作用

Flink核心目标是“数据流上的有状态计算”；Apache Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。

1.1.1有界流和无界流

把流处理需要的额外数据保存成一个”状态“，然后针对这条数据进行处理，并且更新状态。这就是所谓的”有状态的流处理“。

Flink主要特点如下：

高吞吐和低延迟。每秒处理数百万个事件，毫秒级延迟。
结果的准确性。Flink提供了事件事件（event-time）和处理事件（processing-time）语义。对于乱序事件流，事件时间仍然能提供一致且准确的结果。
精确一次（exactly-once）的状态一致性保证。
可以连接到最常用的存储系统，如Kafka、Hive、JDBC、HDFS、Redis等。
高可用。本身高可用的设置，加上与K8s，YARN和Mesos的紧密集成，再加上从故障中快速恢复和动态扩展任务的能力，Flink能够做到以极少的停机时间7*24全天候运行。

2.Flink以流处理为根本

有状态流处理:通过底层API(处理函数)，对最原始数据加工处理。底层API与DataStream API相集成，可以处理复杂的计算
Datastream API(流处理)利DataSetAPI(批处理)封装了底层处理函数，提供了通用的模块，比如转换(tansformations，包括map、flatmap等)，连接(joins)，聚合(aggregdtions)，窗口(windows)操作等。注意:Flink1.12以后，DataStream API已经实现真正的流批一体，所以DataSetAPI已经过时
Table API 是以表为中心的声明式编程，其中表可能会动态变化。Table API遵循关系模型:表有二维数据结构，类似于关系数据库中的表;同时API提供可比较的操作，例如select、project、jomn、group-by、aggregate等。我们可以在表与 DataStream/Dataset 之间无缝切换，以允许程序将Table API与 DataStream 以及 DataSet 混合使用。
SQL这一层在语法与表达能力上与Table API类似，但是是以SQL查询表达式的形式表现程序。SQL抽象与Table API交互密切，同时SQL查询可以直接在Table API定义的表上执行。