spark 工作机制有哪些?

用户在 client 端提交作业后,会由 Driver 运行 main 方法并创建 spark context 上下文。执行 add 算子,形成 dag 图输入 dagscheduler,按照 add 之间的依赖关系划分。


stage 输入 task scheduler。task scheduler 会将 stage 划分为 task set 分发到各个节点的 executor 中执行。


蓝海大脑 京ICP备18017748号-1