spark驱动器是spark应用的核心,作用主要是以下几点:
1.把用户代码转换成物理执行计划,分解成stage阶段,每个stage下包含多个独立的task
2.驱动器节点会跟踪数据的在执行器节点中的存放位置,尽量调度对应的task到对应执行器节点中,以减少网络通信开销
3.驱动器会跟踪执行器节点执行过程中缓存的dataframe数据的位置,当再次调度任务的时候会尽量重用之前的执行器节点
spark执行器是执行task任务的单元,作用主要是以下几点:
1.执行具体的task,把计算结果和进度通知给驱动器节点
2.执行task的过程中会缓存一些dataframe数据到内存中,加快执行速度