联系

比屋教育 大数据高薪实战班(1、2、3期)

内容简介

比屋教育,秉承“活学活用”的教育理念,集合资深专家讲师团队,依托完善的线上教学管控平台,专注于大数据、云计算、互联网架构师等领域的职业技能培训,着力培养满足互联网企业实际需求的高端人才。

比屋教育 大数据高薪实战班(1、2、3期)

资源目录

00-大数据免费课

第1章-大数据概况及Hadoop生态系统

1.什么是大数据和大数据分析.mp4

10.hdfs组件和数据备份策略.mp4

11.hdfs文件读写原理和常用命令使用.mp4

12.HDFS的java客户端.mp4

13.代码测试.mp4

14.课堂总结.mp4

2.分布式运算原理.mp4

3.hadoop的基本介绍.mp4

4.hadoop基本架构.mp4

5.hadoop生态圈介绍.mp4

6.hadoop环境搭建.mp4

7.安装环境测试和hdp环境介绍.mp4

8.Namnode和SNameNode .mp4

9.DataNode讲解.mp4

第2章-MapReduce原理及编程

1.mapreduce的基本介绍.mp4

10.hadoop数据类型.mp4

11.Mapper和Reducer讲解.mp4

12.分布式缓存和Speculative.mp4

13作业讲解.mp4

14.作业测试和总结.mp4

2.mapreduce数据分析详细介绍.mp4

3.mapreduce-wordCount需求讲解.mp4

4.mapreduce实战mapper开发.mp4

5.mapreduce实战reduce和job开发.mp4

6.程序打包运行和总结.mp4

7.案例总结和原理剖析.mp4

8.分区原理和源码分析.mp4

9.什么是逻辑块.mp4

第3章-Apache Hive基础实战

1.hive简介.mp4

10.hive的严格模式和动态分区.mp4

11.Hive数据分桶.mp4

2.hive实现WordCount及元数据管理.mp4

3.hive体系结构.mp4

4.hive数据类型和数据库操作.mp4

5.内部表和外部表的区别.mp4

6.hive外部表的详细操作.mp4

7.CTAS和CTE.mp4

8.临时表及对表的基本操作.mp4

9.hive静态分区讲解.mp4

第4章 Apache Spark基础及架构

1.Spark基本介绍.mp4

2.ApacheSpark安装配置.mp4

3.RDD的基本介绍.mp4

4.Spark案例入门.mp4

5.Spark执行流程和组建介绍.mp4

6.分区,SC,SparkSession,核心数据集.mp4

7.RDD分区,宽窄数据变换.mp4

8.windows平台配置Spark开发环境.mp4

9.RDD算子操作.mp4

第5章 Spark SQL精华及与实战

1.SparkSQL历史发展.mp4

10.自定义UDF和UDAF.mp4

2.SparkSQL执行优化策略.mp4

3.SparkSQL程序入口.mp4

4.SparkSQL案例讲解.mp4

5.DataSet案例演示.mp4

6.RDD转换DataFrame.mp4

7.RDD转换DataFrame方式二.mp4

8.加载多种数据源.mp4

9.读取mysql和hive的数据.mp4

第6章-基于Spark Streaming的流数据处理和分析

1.SparkStreming简介.mp4

2.saprkStream运行机制.mp4

3.SparkStreaming处理流程和入口.mp4

4.自定义数据源.mp4

5.updateStateByKey算子讲解.mp4

6.MapWithState算子讲解.mp4

第7章-Apache Flink基础及架构

1.ApacheFlink的简介.mp4

2.Flink架构和入门案例开发.mp4

3.Flink案例进阶之代码抽取.mp4

4.Flink核心概念行度运算和WEB监控.mp4

5.Flink集群构建.mp4

6.Flink集群模式发布和TaskSlot原理.mp4

7.Flink四种数据传输策略和四层结构图.mp4

第8章-Apache Flink高阶之状态存储-容错-数据恢复

1.状态数据丢失处理之StateBackend概述.mp4

2.StateBackends三种实现方式.mp4

3.如何实现容错和仅一次语义.mp4

4.程序自动恢复数据与核心参数剖析.mp4

5.集群模式下数据容错剖析和多备份.mp4

01-授课视频(试看)

直播授课

Video_2021-09-07_220009.mp4

线下授课

Apache Flink高阶之window分类-自定义窗口

1.window的概述和四种类型.wmv

2.window的源码理解和会话窗口案例实践.wmv

3.底层原理之自定义widnwo.wmv

4.基于Trigger和Evictor自定义窗口函数.wmv

5.增量聚合及aggregate的使用.wmv

6.全量聚合和window的4种Join实现.wmv

视频录制

Apache Hive基础实战

1.hive简介.wmv

10.hive的严格模式和动态分区.wmv

11.Hive数据分桶.wmv

2.hive实现WordCount及元数据管理.wmv

3.hive体系结构.wmv

4.hive数据类型和数据库操作.wmv

5.内部表和外部表的区别.wmv

6.hive外部表的详细操作.wmv

7.CTAS和CTE.wmv

8.临时表及对表的基本操作.wmv

9.hive静态分区讲解.wmv

大数据概况及Hadoop生态系统

1.什么是大数据和大数据分析.wmv

10.hdfs组件和数据备份策略.wmv

11.hdfs文件读写原理和常用命令使用.wmv

12.HDFS的java客户端.wmv

13.代码测试.wmv

14.课堂总结.wmv

2.分布式运算原理.wmv

3.hadoop的基本介绍.wmv

4.hadoop基本架构.wmv

5.hadoop生态圈介绍.mp4

6.hadoop环境搭建.mp4

7.安装环境测试和hdp环境介绍.wmv

8.Namnode和SNameNode .wmv

9.DataNode讲解.wmv

02-大数据架构课(1期)

第一阶段(大数据生态圈核心技术)

第10章-Apache Sqoop介绍及数据迁移

第10章-Apache Sqoop介绍及数据迁移.pdf

第12章-离线数据仓库项目实战开发

code

imgs

1.jpg

10.jpg

11.jpg

12.jpg

13.jpg

14.png

15.png

16.png

17.png

18.png

19.png

2.jpg

20.png

3.jpg

4.jpg

5.jpg

6.jpg

7.jpg

8.jpg

9.jpg

resources

数据文件1.zip

数据文件2.rar

video

1.数据仓库概述和原理.wmv

2.基于大数据构建数据仓库.wmv

3.数据仓库构建流程.wmv

4.数据仓库建模基本理论.wmv

5.完整数据仓库案例演示.wmv

第1章数据仓库项目开发.md

第1章数据仓库项目开发.pdf

第13章-离线数据仓库项目实战开发

code

imgs

1.jpg

2.jpg

3.jpg

4.jpg

5.jpg

6.jpg

resources

video

1.PB级数据仓库构建步骤.wmv

2.创建表的流程和规范.wmv

3.企业级开发规范详解.wmv

4.平台架构设计和资源评估.wmv

第2章-离线数据仓库开发.md

第2章-离线数据仓库开发.pdf

第14章-离线数据仓库项目实战开发

code

imgs

1.jpg

2.jpg

3.jpg

4.jpg

5.jpg

6.jpg

resources

video

1.ODS层数据表创建.wmv

2.ODS层数据导入.wmv

3.DWD层表创建和数据ETL.wmv

4.DWS层用户行为宽表创建.wmv

5.ADS层数据指标分析.wmv

6.ADS层数据指标分析2.wmv

7.订单拉链表设计.wmv

第3章数据仓库项目开发.md

第3章数据仓库项目开发.pdf

第1章-大数据概况及Hadoop生态系统

1.什么是大数据和大数据分析.wmv

10.hdfs组件和数据备份策略.wmv

11.hdfs文件读写原理和常用命令使用.wmv

12.HDFS的java客户端.wmv

13.代码测试.wmv

14.课堂总结.wmv

2.分布式运算原理.wmv

3.hadoop的基本介绍.wmv

4.hadoop基本架构.wmv

5.hadoop生态圈介绍.mp4

6.hadoop环境搭建.mp4

7.安装环境测试和hdp环境介绍.wmv

8.Namnode和SNameNode .wmv

9.DataNode讲解.wmv

img

1.png

10.png

11.png

12.png

13.png

14.png

15.png

2.png

3.png

4.png

5.png

6.png

7.png

8.png

9.png

第一章 大数据概况及Hadoop生态系统.md

第一章 大数据概况及Hadoop生态系统.pdf

第2章-MapReduce原理及编程

1.mapreduce的基本介绍.wmv

10.hadoop数据类型.wmv

11.Mapper和Reducer讲解.wmv

12.分布式缓存和Speculative.wmv

13作业讲解.wmv

14.作业测试和总结.wmv

2.mapreduce数据分析详细介绍.wmv

3.mapreduce-wordCount需求讲解.wmv

4.mapreduce实战mapper开发.wmv

5.mapreduce实战reduce和job开发.wmv

6.程序打包运行和总结.wmv

7.案例总结和原理剖析.wmv

8.分区原理和源码分析.wmv

9.什么是逻辑块.wmv

img

1.jpg

10.png

11.png

12.png

13.png

14.png

15.png

16.png

17.png

18.png

2.jpg

3.png

4.jpg

5.jpg

6.jpg

7.png

8.jpg

9.jpg

第二章-MapReduce原理及编程.md

第二章-MapReduce原理及编程.pdf

第3章-Apache Hive基础实战

1.hive简介.wmv

10.hive的严格模式和动态分区.wmv

11.Hive数据分桶.wmv

2.hive实现WordCount及元数据管理.wmv

3.hive体系结构.wmv

4.hive数据类型和数据库操作.wmv

5.内部表和外部表的区别.wmv

6.hive外部表的详细操作.wmv

7.CTAS和CTE.wmv

8.临时表及对表的基本操作.wmv

9.hive静态分区讲解.wmv

imgs

1.png

10.png

11.png

2.png

3.png

4.png

5.png

6.png

7.png

8.png

9.png

hive的作用.png

内部表和外部表的区别.png

案例数据结构讲解.png

第三章-Apache Hive基础实战.md

第三章-Apache Hive基础实战.pdf

第4章-Apache Hive进阶实战

1.explode和lateralView讲解.wmv

10.Hive的集合set,list.wmv

11.数据分片.wmv

12.PERCENT_RANK讲解.wmv

13.FIRST_VALUE,LAST_VALUE.wmv

14.窗口函数-行类窗口的讲解.wmv

15.范围类窗口函数.wmv

2.hive的select虚拟列和基本的Join.wmv

3.hive虚拟列和基本的数据Join.wmv

4.hive的基本join操作.wmv

5.hive的LOAD和insert的使用.wmv

6.hive的数据迁移.wmv

7.按照position进行排序.wmv

8.sortBy,DistributeBy.wmv

9.GroupBy和having.wmv

Apache Hive进阶实战.pdf

第5章-Apache Hive高级实战

1.hive的事务讲解.wmv

2.MERGE语法的使用.wmv

3.hive的自定义 函数.wmv

4.hive性能优化.wmv

5.本地运行和JVM重用.wmv

6.总结.wmv

Apache Hive高级实战.pdf

第6章-项目实战-日志数据分析

1.需求讲解和环境准备.wmv

2.日志数据ETL开发(1).mp4

3.日志数据ETL开发(2).wmv

4.日志数据ETL开发(3).wmv

5.日志数据ETL开发(4).wmv

第六章-项目实战-日志数据分析.pdf

第7章-项目实战-用户消费行为数据分析

1.项目需求和数据模型讲解.wmv

10.交易维度指标分析(6).wmv

11.商家维度指标分析(7).wmv

12.评分维度指标分析(8).wmv

13.数据可视化.wmv

2.数据清洗之数据加密和过滤.wmv

3.数据清洗2.wmv

4.客户维度数据分析.wmv

5.交易维度指标分析(1).wmv

6.交易维度指标分析(2).wmv

7.交易维度指标分析(3).wmv

8.交易维度指标分析(4).wmv

9.交易维度指标分析(5).wmv

项目实战-案例分析之消费数据_带分层.pdf

第8章-NoSQL综述和Apache HBase基础

1.NoSql的基本概念.wmv

2.Nosql的分类和存储区别.wmv

3.Hbaes介绍.wmv

4.Hbase的用例.wmv

5.Hbase的物理架构.wmv

6.Hbase表和RegionServer的关系.wmv

7.hbase的rows.wmv

8.Hbase数据管理和体系结构优势.wmv

9.Hbase的Shell操作和总结.wmv

第9章-Apache HBase API介绍及性能优化

1.Hbase的javaAPI.wmv

10.Minor和Major压缩测路,总结.wmv

2.使用java客户端插入数据.wmv

3.使用java客户端扫描数据.wmv

4.使用Java客户端删除操作.wmv

5.代码测试.wmv

6.RestAPI的使用.wmv

7.Phoenix的使用.wmv

8.使用Hive关联Hbase表.wmv

9.名称空间,授权,数据压缩.wmv

第九章-Apache HBase API介绍及性能优化.pdf

第二阶段(大数据高级开发核心技术)

kafka

1.KafkaProducer原理.wmv

1.kafka集群版安装.wmv

1.读取kafka数据消费到hbase.wmv

2.Kafka的ISR和ACKS.wmv

2.kafka集群构建.wmv

2.UserConsumer业务代码编写.wmv

3.consuler的机制.wmv

3.Kafka的主题介绍.wmv

3.代码测试.wmv

4.Kafka高效读写.wmv

5.Producer案例实现1.wmv

6.Producer案例实现2.wmv

7.代码测试.wmv

第10章-Apache Flink基础及架构

1.ApacheFlink的简介.wmv

2.Flink架构和入门案例开发.wmv

3.Flink案例进阶之代码抽取.wmv

4.Flink核心概念行度运算和WEB监控.wmv

5.Flink集群构建.wmv

6.Flink集群模式发布和TaskSlot原理.wmv

7.Flink四种数据传输策略和四层结构图.wmv

第11章-Apache Flink进阶之算子和状态管理

1.Flink自定义数据源.wmv

10.基于状态的数据合并案例开发.wmv

2.Flink常规算子讲解.wmv

3.Flink核心算子讲解.wmv

4.Sink操作及托管状态和原始状态.wmv

5.OperatorState和KeyedState.wmv

6.ValueState状态案例演示.wmv

7.KeyedState之ListState案例演示.wmv

8.KeyedState之MapState案例演示.wmv

9.Reduc和Aggregat案例演示.wmv

第12章-Apache Flink高阶之状态存储-容错-数据恢复

1.状态数据丢失处理之StateBackend概述.wmv

2.StateBackends三种实现方式.wmv

3.如何实现容错和仅一次语义.wmv

4.程序自动恢复数据与核心参数剖析.wmv

5.集群模式下数据容错剖析和多备份.wmv

第13章-Apache Flink高阶之WaterMark原理剖析与应用

1.TimeWindow的窗口运行机制.wmv

2.Time的三种类型和EventTime案例实践.wmv

3.引入WaterMark解决案例的遗留问题.wmv

4.Watermark触发机制与核心原理.wmv

5.基于watermark数据丢失的三种解决方案.wmv

6.多并行度watermark的触发机制.wmv

第14章-Apache Flink高阶之window分类-自定义窗口-源码剖析-Join

1.window的概述和四种类型.wmv

2.window的源码理解和会话窗口案例实践.wmv

3.底层原理之自定义widnwo.wmv

4.基于Trigger和Evictor自定义窗口函数.wmv

5.增量聚合及aggregate的使用.wmv

6.全量聚合和window的4种Join实现.wmv

第15章-Apache Flink实时报表案例开发

1.FLink企业实战之需求讲解.wmv

2.FLink企业实战之业务代码实现.wmv

3.多并行度情况下数据传输策略引发的问题.wmv

4.多并行度情况下数据缺失解决方案.wmv

5.企业实战-实时报表需求讲解.wmv

6.企业实战-实时报表业务代码实现.wmv

7.FlinkOnYarn启动程序的二中方案.wmv

第1章 Scala编程基础

1.scala基本介绍.wmv

10.数组的操作.wmv

11.Set和Map的操作.wmv

12.枚举和Null.wmv

13.Noting,Nil,None,Option.wmv

14.Success,Failure.wmv

15.SuccessAndFailure.wmv

16.高阶函数.wmv

17.嵌套函数.wmv

18.柯里化.wmv

19.函数赋值和下划线的使用.wmv

2.scala输出hello World!.wmv

3.变量和常量.wmv

4.函数.wmv

5.循环.wmv

6.map和filter方法讲解.wmv

7.break代码块.wmv

8.数据类型和Tuple的讲解.wmv

9.collection的介绍.wmv

第2章 Scala编程进阶

1.Trait讲解.wmv

10.scala中嵌入Java代码.wmv

11.scala总结.wmv

2.Class和伴生对象.wmv

3.caseClass定义.wmv

4.CaseClass和Enumeration的区别.wmv

5.apply和unapply.wmv

6.Mixin多继承调用关系.wmv

7.列表生成式.wmv

8.正则表达式讲解.wmv

9.匹配分组.wmv

第3章 Apache Spark基础及架构

1.Spark基本介绍.wmv

2.ApacheSpark安装配置.wmv

3.RDD的基本介绍.wmv

4.Spark案例入门.wmv

5.Spark执行流程和组建介绍.wmv

6.分区,SC,SparkSession,核心数据集.wmv

7.RDD分区,宽窄数据变换.wmv

8.windows平台配置Spark开发环境.wmv

9.RDD算子操作.wmv

第4章 Apache Spark分布式计算原理

1.Lineage和DAG的介绍.wmv

2.RDD的Lineage和DAG和数据迁移.wmv

3.Spark的cache和checkpoint.wmv

4.广播变量的使用.wmv

5.分区的控制和数据倾斜.wmv

6.spark加载CSV和Json数据文件.wmv

第5章 Spark SQL精华及与实战(1)

1.SparkSQL历史发展.wmv

10.自定义UDF和UDAF.wmv

2.SparkSQL执行优化策略.wmv

3.SparkSQL程序入口.wmv

4.SparkSQL案例讲解.wmv

5.DataSet案例演示.wmv

6.RDD转换DataFrame.wmv

7.RDD转换DataFrame方式二.wmv

8.加载多种数据源.wmv

9.读取mysql和hive的数据.wmv

第6章 Spark SQL精华及与实战(2)

11.自定义函数案例.wmv

12.窗口函数案例讲解.wmv

13.案例实现1.wmv

14.案例实现2.wmv

第7章-基于Spark Streaming的流数据处理和分析(1)

1.SparkStreming简介.wmv

2.saprkStream运行机制.wmv

3.SparkStreaming处理流程和入口.wmv

4.自定义数据源.wmv

5.updateStateByKey算子讲解.wmv

6.MapWithState算子讲解.wmv

第8章-基于Spark Streaming的流数据处理和分析(2)

10.Streaming程序的容错处理.wmv

7.transform案例讲解.wmv

8.窗口计算.wmv

9.foreachRDD案例讲解.wmv

第9章-基于Spark Streaming的流数据处理和分析(3)

1.如何保证数据不丢失和优化机制.wmv

2.kafka整合0.8版本方案一.wmv

3.kafka整合0.8版本方案二.wmv

4.kafka整合0.8版本手动管理偏移量.wmv

5.kafka整合10版本手动管理偏移量.wmv

6.如何保证Exactly-Once.wmv

03-大数据架构课(2期)

Flink实时运营系统

Video_2021-11-27_215949.wmv

Video_2021-11-28_115409.wmv

Video_2021-11-29_213337.mp4

第10章-Hive-数据仓库高阶精讲

Video_2021-07-28_220239.wmv

第11章-Hive-数据仓库高阶精讲

Video_2021-07-31_221020.mp4

第12章-项目实战-日志数据分析

Video_2021-08-01_221056.wmv

第13章-项目实战-用户消费行为数据分析01

Video_2021-08-02_220253.wmv

第14章-项目实战-用户消费行为数据分析02

Video_2021-08-07_220619.wmv

第15章-Nosql综述和ApacheHBase集群构建

Video_2021-08-08_222632.wmv

第16章-ApacheHBase基础和核心组件

Video_2021-08-09_220455.wmv

第17章-Apache Hbase 进阶及性能优化

Video_2021-08-14_220523.wmv

第18章-Apache Sqoop介绍及数据迁移

Video_2021-08-15_220638.wmv

第19章-ZooKeeper的核心设计和企业级应用

Video_2021-08-16_220727.wmv

第1章-开班典礼

Video_2021-07-05_214925.wmv

第20章-企业级离线数据仓库项目实战开发01

Video_2021-08-21_220233_剪辑.wmv

第21章-企业级离线数据仓库项目实战开发02

Video_2021-08-22_220736.wmv

第22章-企业级离线数据仓库项目实战开发03

Video_2021-08-23_220339.wmv

第23章-hadoop源码调优课程

Video_2021-08-28_220405.wmv

第24章-企业级离线数据仓库项目实战开发04

Video_2021-08-29_220553.wmv

第25章-企业级离线数据仓库项目实战开发05

Video_2021-08-30_214432.wmv

第26章-精通Scala编程语言01

Video_2021-08-30_220558.wmv

第27章-精通Scala编程语言02

Video_2021-09-04_220805.wmv

第28章-精通Scala编程语言03

Video_2021-09-05_220855.wmv

第29章-hadoop源码调优课程

Video_2021-09-07_220009.wmv

第2章-大数据概况及Hadoop生态系统

Video_2021-07-10_222441.wmv

第30章-精通Scala编程语言04

Video_2021-09-11_220147.wmv

第31章-精通Scala编程语言05

Video_2021-09-12_220249.wmv

第32章-精通Scala编程语言06

Video_2021-09-13_215340.wmv

第33章-ApacheSpark基础及架构

Video_2021-09-15_220058.wmv

无标题.png

无标题2.png

第34章-ApacheSpark基础及架构

Video_2021-09-16_220132.wmv

第35章-ApacheSpark基础及架构

Video_2021-09-17_220729.wmv

第36章-ApacheSpark进阶及优化

rdd执行顺序.png

Video_2021-09-25_220301.wmv

第37章-ApacheSpark分布式计算原理

Video_2021-09-26_221503.wmv

Video_2021-09-26_2215031.mp4

第38章-ApacheSpark企业级项目实战

Video_2021-09-27_215844.wmv

Video_2021-09-27_2158440.mp4

第39章-SparkSQL精华及实战基础

Video_2021-10-02_220126.wmv

第3章-Hadoop集群构建&核心模块讲解

Video_2021-07-11_221926.wmv

第40章-SparkSQL精华及实战进阶

Video_2021-10-03_220232.wmv

第41章-SparkSQL企业级项目实战

Video_2021-10-07_220925.wmv

第42章-Kafka基础

Video_2021-10-09_220106.wmv

第43章-Kafka进阶

Video_2021-10-10_220241.wmv

第44章-Spark Streaming的流数据处理和分析

Video_2021-10-11_220644.wmv

第45章-Spark Streaming的流数据进阶

Video_2021-10-15_220209.wmv

第46章-Apache Flume 基础及使用案例

Video_2021-10-16_220352.mp4

第47章-河马物流数据仓库

Video_2021-10-18_230203.wmv

第48章-河马物流数据仓库

Video_2021-10-23_225724.mp4

第49章-河马物流数据仓库

Video_2021-10-25_215945.wmv

第4章-MapReduce原理&优化&企业级案例实战

Video_2021-07-12_220536.wmv

第50章-河马物流数据仓库

Video_2021-10-26_220241.wmv

第51章-河马物流数据仓库

Video_2021-10-30_214402.wmv

第52章-Flink精品课程

Video_2021-10-31_220624.wmv

第53章-Flink精品课程

task和taskSlots的关系.png

Video_2021-11-01_220108.wmv

第54章-Flink精品课程

Video_2021-11-06_215800.wmv

第55章-Flink精品课程

Video_2021-11-07_220041.mp4

第56章-Flink精品课程

Video_2021-11-08_220134.mp4

第57章-Flink精品课程

Video_2021-11-13_221833.mp4

第58章-Flink精品课程

Video_2021-11-14_220326.wmv

第59章-Flink精品课程

Video_2021-11-15_220143.mp4

第5章-Hive-数据仓库基础精讲

Video_2021-07-17_221319.wmv

第60章-Flink精品课程

Video_2021-11-20_220230.mp4

第61章-Flink精品课程

Video_2021-11-21_220546.wmv

第6章-Hive-数据仓库基础精讲

Video_2021-07-18_220142.wmv

第7章-Hive-数据仓库进阶精讲

Video_2021-07-19_215651.wmv

第8章-Hive-数据仓库进阶精讲

Video_2021-07-24_221515.wmv

第9章-Hive-数据仓库高阶精讲

Video_2021-07-25_220412.wmv

配套画图

day01

day02

day03

dataNode保存数据块.png

mapreduce工作的机制.png

namenode.png

SecondaryNameNode理论.png

机架感知.png

笔记.txt

day04

mapreduce运行原理.png

map到redcue过程.png

map和reduce概要.png

图 3.png

day05

mapreduce分区.png

为什么要学习Hive.png

分布式缓存.png

day06

1.png

2.png

day07

1.png

2.png

day08

day11

数据倾斜.png

数据倾斜1.png

04-大数据架构课(3期)

1.大数据概况及Hadoop生态系统.wmv

10.源码理解和自定义分区.wmv

11.分布式缓存和Speculative机制.wmv

12.Hive的基本简介和集群构建.wmv

13.Hive元数据管理.wmv

14.Hive的数据类型CTE和CTAS.wmv

15.Hive的动态分区和静态分区.wmv

16.Hive的分桶和视图讲解.wmv

17.Hive的进阶查询和数据迁移.wmv

18.Hive的进阶查询语法1.wmv

19.分析函数和窗口函数的使用.wmv

2.OLAP&OLTP&Hadoop组件讲解&基本配置.wmv

20.分析函数和窗口函数和窗口函数子句.wmv

21.Hive的事务和自定义函数.wmv

22.Hive的数据据倾斜和性能优化.wmv

23.项目需求分析和数据清洗.wmv

24.日志数据清洗过程1.wmv

25.日志数据清洗过程2.wmv

26.数据分析之常用指标计算.wmv

27.用户消费行为数据分析-1.wmv

28.用户消费行为数据分析-2.wmv

29.用户消费行为数据分析-3.wmv

3.HDFS上传数据原理剖析和单机版配置.wmv

30.用户消费行为数据分析-4.wmv

31.Nosql的综述.wmv

32.Aapache Hbase的简介和环境构建.wmv

33.HBase的存储机制.wmv

34.HBase的客户端操作.wmv

35.HBase数据操作详解.wmv

36.HBase的SQL支持和Hive支持.wmv

37.sqoop的基础入门.wmv

38.Sqoop数据迁移的实现.wmv

39.zookeeper的安装和基本参数解析.wmv

4.Hadoop环境BUG解决和集群配置.wmv

40.zookeeper数据数据结构和基本操作.wmv

41.zookeeper的Java客户端操作.wmv

42.zookeeper的基本代码结构和监听器应用.wmv

43.Zookeeper案例剖析.wmv

44.企业级数据仓库项目实战-1.wmv

45.企业级数据仓库项目实战-2.wmv

5.NameNode&DataNode&SNN进程原理剖析.wmv

6.Hadoop的存储和安全模式.wmv

7.MapReduce的基本介绍.wmv

8.MapReduce流程剖析.wmv

9.mapreduce案例编写和剖析.wmv

课程配图

第3章课堂画图

19.png

mapreduce的处理流程.png

保存小文件的问题.png

并行度和分布.png

无标题.png

无标题2.png

节点之间的关系.png

第4章课堂画图

画图

1.png

2.png

您可能还喜欢...

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注