创建执行环境：每个Flink应用程序都需要一个执行环境，通常用env表示。流式应用需要使用StreamExecutionEnvironment。通过调用getExecutionEnvironment()方法可以获取默认的执行环境，或者使用createLocalEnvironment()和createRemoteEnvironment()来创建本地或远程执行环境5 6 7 11 12 14。
配置执行模式：执行环境支持不同的执行模式，如BATCH模式，可以通过特定的配置方法来设置6。
设置作业属性：通过执行环境，可以设置作业的属性，例如默认并发度、重启策略等7 11 12 14。

构建作业图：DataStream API将应用程序构建为一个作业图（job graph），并附加到StreamExecutionEnvironment。这个作业图在调用env.execute()时被打包并发送到JobManager，由JobManager负责作业的并行处理和子任务的分配8 16。
创建源和接收器：执行环境允许开发者创建数据流的源（source）和接收器（sink），这是流处理程序中数据输入和输出的关键部分9。
触发作业执行：最终，通过调用执行环境的execute()方法，触发作业的执行7 11 12 14。

环境准备：在使用Python DataStream API时，需要安装PyFlink，它发布在PyPI上，可以通过pip安装17。
Java和Scala支持：Java DataStream API的核心类可以在org.apache.flink.streaming.api.scala包中找到，而Scala的DataStream API则提供了对可序列化对象的转换支持，包括基本类型和复合类型15 18 19。

通过上述信息，我们可以看到执行环境在Flink DataStream API中扮演着核心角色，它不仅负责作业的配置和执行，还涉及到作业图的构建和任务的分配。开发者需要熟悉如何创建和配置执行环境，以便有效地开发和部署Flink流处理应用程序。

更简洁一些

转笔记

简洁

Apache Flink——DataStream API 执行环境

Apache Flink DataStream API 编程模型

Flink DataStream API 与 DataSet API 比较

Flink DataStream API 状态管理

相关内容12

DataStream API 执行环境5	执行环境定义每个 Flink 应用都需要有执行环境，用于构建 job graph。
创建执行环境6	执行环境创建通过 getExecutionEnvironment 或 createLocalEnvironment 创建执行环境。
执行模式配置6	执行模式设置配置 BATCH 模式，影响程序执行方式。
StreamExecutionEnvironment 声明7	流式程序上下文声明执行环境，设置作业属性，创建源，触发作业执行。
执行环境与 job graph8	job graph 构建 DataStream API 将应用构建为 job graph，附加到执行环境。
执行环境的执行8	作业执行触发调用 env.execute() 打包并发送 job graph 至 JobManager。
StreamExecutionEnvironment5	执行环境基础流式应用的核心，用于设置作业属性、创建源、触发执行。
JobManager8	作业管理器负责作业的并行处理和子任务的分配给Task Manager。
TaskManager8	任务管理器执行JobManager分配的子任务，参与作业的并行处理。
StreamExecutionEnvironment7	执行环境基础流式程序执行的上下文，用于设置作业属性和触发作业执行。
JobManager16	作业管理器负责作业的并行处理和子任务的分配给Task Manager。
TaskManager16	任务管理器接收JobManager分配的子任务并执行。

在线客服