联系

马士兵教育 MCA小课 Spark体系

内容简介

大家好,我是本课程的讲师周志垒。企业中有了海量数据就会使用大数据相关计算框架进行分析处理,在早期大数据处理中,我们会选择使用MapReduce分析处理海量数据,MapReduce存在计算慢、代码编写复杂、不支持流式计算及性能上的一些问题,Apache Spark计算框架的出现解决了MapReduce计算框架以上各种问题,Apache Spark是新一代的大数据计算框架,支持针对批量数据及流式数据进行处理,在数据处理上相对比MapReduce性能上提升很多,不仅编程方便还支持SQL处理数据、流式编程等。

在本课程内容全面涵盖了Spark生态系统的各个技术点,包含Spark架构、Spark任务提交、Spark数据处理模型、Spark资源调度、Shuffle原理、内存管理、参数优化、SparkSQL、SparkStreaming、各阶段源码分析等内容,此课程不仅面相项目开发人员,对于研究Spark的群体此课程都是非常有学习指导意义的课程。

如果正在学习大数据,对大数据Spark计算技术不熟悉,甚至工作中正在使用大数据,那么Spark一定是大数据技术中的重中之重,选择这门课程可以让你对Spark的底层原理、企业级实战应用有更深层次的理解,快点加入课程提升自己的技术吧。

马士兵教育 MCA小课 Spark体系

资源目录

——/计算机教程/15-马士兵教育/063-Spark体系/

01_scala语言、函数式编程、数据集处理、iterator设计模式实现.7z 1.79G

02_scala语言、流程控制、高级函数.7z 1.22G

03_scala语言、集合容器、iterator设计模式源码分析.7z 1.63G

04_scala语言、match、case class、implicitt、spark wordcount.7z 1.70G

05_spark-core、复习hadoop生态、梳理术语、hadoopRDD 源码分析.7z 1.76G

06_spark-core、wordcount案例源码分析、图解.7z 1.81G

07_spark-core、集合操作API、pvuv分析、RDD源码分析.7z 1.79G

08_spark-core、聚合计算API、combineByKey、分区调优.7z 1.85G

09_spark-core、二次排序、分组取TopN、算子综合应用.7z 2.02G

10_spark-core、集群框架图解、角色功能介绍、官网学习 、搭建.7z 1.81G

11_spark-core、history服务、standaloneHA、资源调度参数.7z 1.79G

12_spark-core、基于yarn的集群搭建、配置、资源调度参数、优化jars.7z 1.23G

13_spark-core-源码、RpcEnv、standaloneMaster启动分析.7z 1.86G

14_spark-core-源码、Worker启动、sparksubmit提交、Driver启动.7z 1.87G

15_park-core-源码、Application注册、Executor资源申请.7z 1.81G

16_spark-core-源码、sparkContext、DAGScheduler、stage划分.7z 1.86G

17_spark-core-源码、TaskScheduler、Executor运行Task、SparkEnv.7z 2.11G

18_spark-core-源码、MemoryManager、BlockManager.7z 1.87G

19_spark-core-源码、Dependency、SortShuffleManager.7z 1.93G

20_spark-core-源码、SortShuffleWriter、内存缓冲区buffer.7z 1.86G

21_spark-core-源码、SortShuffleWriter、内存缓冲区buffer.7z 2.28G

22_spark-core-源码、UnsafeShuffleWriter、Tungsten、Unsafe、堆外.7z 1.84G

23_spark-core-源码、ShuffleReader、Tracker、Scheduler完整调度.7z 2.24G

24_spark-core-源码、RDD持久化、检查点、广播变量、累加器.7z 2.03G

25_spark-core-源码、RDD持久化、检查点、广播变量、累加器.7z 2.17G

26_spark-sql、大数据中的SQL组成原理.7z 1.61G

27_spark-sql、datafram到dataset开发.7z 2.15G

28_spark-sql、整合hive的metastore搭建企业级数仓1.7z 1.91G

29_spark-sql、整合hive的metastore搭建企业级数仓2.7z 1.75G

30_spark-sql、复杂sql、函数、自定义函数、开窗over函数、OLAP.7z 1.58G

31_spark-sql-源码、sql解析、dataset到rdd的执行计划.7z 2.03G

32_spark-sql-源码、antlr4的sql解析、AST语法树的逻辑到物理转换.7z 1.39G

33_spark-sql-源码、逻辑计划、优化器、物理计划、转换RDD.7z 1.77G

34_spark-streaming、流式计算之微批计算原理及standalone.7z 1.74G

35_spark-streaming、api、ha、检查点、窗口等机制.7z 1.70G

36_spark-streaming、整合MQ-kafka开发.7z 2.31G

37_spark-streaming、源码分析、流式微批任务的调度原理.7z 1.99G

38_spark-streaming.7z 2.20G

您可能还喜欢...

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注