新手入门大数据hadoop基础与电商行为日志分析视频教程新手入门大数据hadoop基础与电商行为日志分析

新手入门大数据hadoop基础与电商行为日志分析视频教程新手入门大数据hadoop基础与电商行为日志分析

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

新手入门大数据hadoop基础与电商行为日志分析视频教程新手入门大数据hadoop基础与电商行为日志分析

资源详情

a0443《新手入门大数据hadoop基础与电商行为日志分析视频教程》本课程从hadoop核心技术入手.以电商项目为依托.带领你从0基础开始上手.逐步掌握大数据核心技术(如:hdfs、yarn、mapreduce以及hive).并使用这些技术进行实战.最终完成电商行为日志分析项目.让你轻松入门大数据!

java视频教程目录:

第1章 大数据概述本章将从故事说起.让大家明白大数据是与我们的生活息息相关的.并不是遥不可及的.还会介绍大数据的特性.以及大数据对我们带来的技术变革.大数据处理过程中涉及到的技术以及大数据典型应用。1-1 课程导学 试看1-2 ***学前必读***(助你平稳踩坑.畅学无忧.课程学习与解决问题指南)1-3 课程目录1-4 从一个案例说起1-5 什么是大数据以及大数据的4v特征 试看1-6 大数据带来的技术变革1-7 大数据现存的模式1-8 大数据的技术概念1-9 大数据带来的挑战1-10 如何对大数据进行存储和分析1-11 大数据典型应用第2章 初识hadoop本章节将带领大家认识hadoop以及hadoop生态系统、hadoop的发展史、hadoop的优势、hadoop的三个核心组件、hadoop发行版的选择.为后续深入讲解hadoop打下坚实的基础。2-1 课程目录2-2 hadoop概述2-3 hadoop核心组件之hdfs概述2-4 hadoop核心组件之mapreduce2-5 hadoop核心组件之yarn2-6 hadoop优势2-7 hadoop发展史2-8 hadoop生态圈2-9 hadoop发行版选型2-10 ootb环境的使用第3章 分布式文件系统hdfs本章将从hadoop的设计目标、架构及文件系统命令空间出发.快速搭建单节点伪分布式hdfs的实验环境.通过讲解使用hdfs shell以及java api的方式操作hdfs文件系统.详细分析hdfs文件的读写流程.并通过hdfsapi来实现词频统计案例.使得大家对hadoop分布式文件系统hdfs有深刻的认识以及实战。 …

2 vu! ?* x* k6 m3 k’ m/ s

3-1 hdfs概述3-2 hdfs设计目标3-3 hdfs架构详解3-4 文件系统namespace详解3-5 hdfs副本机制3-6 本课程使用的linux环境介绍3-7 hadoop部署前置介绍3-8 jdk1.8部署详解3-9 ssh无密码登陆部署详解3-10 hadoop安装目录详解及hadoop-env配置3-11 hdfs格式化以及启动详解3-12 hdfs常见文件之防火墙干扰3-13 hadoop停止集群以及如何单个进程启动3-14 hadoop命令行操作详解3-15 深度剖析hadoop文件的存储机制3-16 hdfs api编程之开发环境搭建3-17 hdfs api编程之第一个应用程序的开发3-18 hdfs api编程之junit封装3-19 hdfs api编程之查看hdfs文件内容3-20 hdfs api编程之创建文件并写入内容3-21 hdfs api编程之副本系数深度剖析3-22 hdfs api编程之重命名3-23 hdfs api编程之copyfromlocalfile3-24 hdfs api编程之带进度的上传大文件3-25 hdfs api编程之下载文件3-26 hdfs api编程之列出文件夹下的所有内容3-27 hdfs api编程之递归列出文件夹下的所有文件3-28 hdfs api编程之查看文件块信息3-29 hdfs api编程之删除文件3-30 hdfs项目实战之需求分析3-31 hdfs项目实战之代码框架编写3-32 hdfs项目实战之自定义上下文3-33 hdfs项目实战之自定义处理类实现3-34 hdfs项目实战之功能实现3-35 hdfs项目实战之使用自定义配置文件重构代码3-36 hdfs项目实战之使用反射创建自定义mapper对象3-37 hdfs项目实战之可插拔的业务逻辑处理3-38 hdfs replica placement policy3-39 hdfs写数据流程图解3-40 hdfs读数据流程图解3-41 hdfs checkpoint详解3-42 hdfs savemode第4章 分布式计算框架mapreduce本章将从架构、编程模型等角度带大家认识hadoop的分布式计算框架mapreduce.掌握mapreduce各个核心组件编程.并通过两个案例让大家深入掌握mapreduce编程的方方面面。4-1 课程目录4-2 mapreduce概述4-3 mapreduce编程模型详解4-4 mapreduce编程模型核心概念详解4-5 词频统计之自定义mapper实现4-6 词频统计之自定义reducer实现4-7 词频统计之自定义driver类实现4-8 词频统计之本地方式运行4-9 词频统计之通过debug方式进一步了解偏移量以及重构代码4-10 词频统计升级之combiner操作 试看4-11 流量统计实战之需求4-12 流量统计实战之自定义复杂数据类型4-13 流量统计实战之自定义mapper类4-14 流量统计实战之自定义reducer实现4-15 流量统计实战之driver开发4-16 流量统计实战之代码重构及nullwritable的使用4-17 流量统计实战升级之自定义partitioner第5章 资源调度框架yarn本章将从yarn的产生背景、yarn的架构及执行流程的角度带大家认知hadoop的资源调度框架yarn.快速搭建单节点伪分布式yarn的实验环境并掌握如何提交mapreduce作业提交到yarn上运行。5-1 课程目录5-2 yarn产生背景5-3 yarn概述5-4 yarn架构详解5-5 yarn执行流程5-6 yarn环境部署5-7 提交example案例到yarn上运行5-8 提交流量统计案例到yarn上运行第6章 电商项目实战hadoop实现本章将通过电商用户行为日志分析的项目实战.来将前面几个章节讲解的知识点串联起来.综合使用hadoop的技术进行离线统计分析。6-1 课程目录6-2 用户行为日志概述6-3 为什么要记录用户行为日志6-4 日志内容介绍6-5 用户行为日志分析的意义所在6-6 电商常用术语6-7 项目需求描述6-8 数据处理流程及技术架构6-9 浏览量统计功能实现6-10 省份浏览量统计之ip库解析6-11 省份浏览量统计之日志解析6-12 省份浏览量统计之功能实现6-13 页面浏览量统计之页面编号获取6-14 页面浏览量统计之功能实现6-15 数据处理过程中etl的重要性6-16 原始日志etl操作6-17 浏览量统计功能升级6-18 省份浏览量统计功能升级6-19 页面浏览量统计功能升级思路6-20 打包到服务器上运行6-21 项目扩展第7章 数据仓库hive本章将从hive的产生背景、体系架构、hive部署、ddl以及dml来掌握hive使用的方方面面。

4 ~1 r7 ]6 |k3 ^r

7-1 课程目录7-2 hive产生背景7-3 hive是什么7-4 为什么要使用hive7-5 hive在hadoop生态圈中的位置7-6 hive体系架构7-7 hive部署架构7-8 hive与rdbms的区别7-9 hive部署7-10 hive快速入门7-11 hive ddl之数据库操作7-12 hive ddl之表操作7-13 hive dml之加载和导出数据7-14 hive ql基本统计7-15 hive ql之聚合函数7-16 hive ql之分组函数7-17 hive ql之join的使用7-18 hive ql执行计划第8章 电商项目实战hive实现本章将使用hive对电商用户行为日志分析进行重新实现.让大家对mapreduce编程和hive实现的方式进行对比.体会hive在生产上使用的便捷性。8-1 课程目录8-2 外部表在hive中的使用8-3 track_info分区表的创建8-4 将etl的数据加载到hive表8-5 使用hive完成统计分析功能8-6 hive实现项目的方便性体现第9章 hadoop分布式集群搭建本章将带领大家搭建一个三个节点的分布式hadoop集群环境.让大家对于hadoop集群的安装有更深入的认识.并将项目实战案例运行在分布式集群环境中。

” m9 `’ ?* o1 f9 h3 r: x

9-1 课程目录9-2 hadoop集群规划9-3 前置条件安装9-4 jdk安装9-5 hadoop集群部署9-6 提交作业到hadoop集群上运行9-7 课程总结第10章 (彩蛋番外篇)join在mapreduce中的实现本章将从sql中的join入手.详细剖析如何在mapreduce中实现join.这是面试中经常被考察到的点.考察你的mapreduce功底以及优化策略。

! j# n$ y; ~; t. r) t$ z& c

10-1 join概述10-2 reducejoin流程分析10-3 reducejoin功能实现10-4 mapjoin实现原理10-5 mapjoin功能实现

资源详情

a0443《新手入门大数据hadoop基础与电商行为日志分析视频教程》本课程从hadoop核心技术入手.以电商项目为依托.带领你从0基础开始上手.逐步掌握大数据核心技术(如:hdfs、yarn、mapreduce以及hive).并使用这些技术进行实战.最终完成电商行为日志分析项目.让你轻松入门大数据!

java视频教程目录:

第1章 大数据概述本章将从故事说起.让大家明白大数据是与我们的生活息息相关的.并不是遥不可及的.还会介绍大数据的特性.以及大数据对我们带来的技术变革.大数据处理过程中涉及到的技术以及大数据典型应用。1-1 课程导学 试看1-2 ***学前必读***(助你平稳踩坑.畅学无忧.课程学习与解决问题指南)1-3 课程目录1-4 从一个案例说起1-5 什么是大数据以及大数据的4v特征 试看1-6 大数据带来的技术变革1-7 大数据现存的模式1-8 大数据的技术概念1-9 大数据带来的挑战1-10 如何对大数据进行存储和分析1-11 大数据典型应用第2章 初识hadoop本章节将带领大家认识hadoop以及hadoop生态系统、hadoop的发展史、hadoop的优势、hadoop的三个核心组件、hadoop发行版的选择.为后续深入讲解hadoop打下坚实的基础。2-1 课程目录2-2 hadoop概述2-3 hadoop核心组件之hdfs概述2-4 hadoop核心组件之mapreduce2-5 hadoop核心组件之yarn2-6 hadoop优势2-7 hadoop发展史2-8 hadoop生态圈2-9 hadoop发行版选型2-10 ootb环境的使用第3章 分布式文件系统hdfs本章将从hadoop的设计目标、架构及文件系统命令空间出发.快速搭建单节点伪分布式hdfs的实验环境.通过讲解使用hdfs shell以及java api的方式操作hdfs文件系统.详细分析hdfs文件的读写流程.并通过hdfsapi来实现词频统计案例.使得大家对hadoop分布式文件系统hdfs有深刻的认识以及实战。 …

2 vu! ?* x* k6 m3 k’ m/ s

3-1 hdfs概述3-2 hdfs设计目标3-3 hdfs架构详解3-4 文件系统namespace详解3-5 hdfs副本机制3-6 本课程使用的linux环境介绍3-7 hadoop部署前置介绍3-8 jdk1.8部署详解3-9 ssh无密码登陆部署详解3-10 hadoop安装目录详解及hadoop-env配置3-11 hdfs格式化以及启动详解3-12 hdfs常见文件之防火墙干扰3-13 hadoop停止集群以及如何单个进程启动3-14 hadoop命令行操作详解3-15 深度剖析hadoop文件的存储机制3-16 hdfs api编程之开发环境搭建3-17 hdfs api编程之第一个应用程序的开发3-18 hdfs api编程之junit封装3-19 hdfs api编程之查看hdfs文件内容3-20 hdfs api编程之创建文件并写入内容3-21 hdfs api编程之副本系数深度剖析3-22 hdfs api编程之重命名3-23 hdfs api编程之copyfromlocalfile3-24 hdfs api编程之带进度的上传大文件3-25 hdfs api编程之下载文件3-26 hdfs api编程之列出文件夹下的所有内容3-27 hdfs api编程之递归列出文件夹下的所有文件3-28 hdfs api编程之查看文件块信息3-29 hdfs api编程之删除文件3-30 hdfs项目实战之需求分析3-31 hdfs项目实战之代码框架编写3-32 hdfs项目实战之自定义上下文3-33 hdfs项目实战之自定义处理类实现3-34 hdfs项目实战之功能实现3-35 hdfs项目实战之使用自定义配置文件重构代码3-36 hdfs项目实战之使用反射创建自定义mapper对象3-37 hdfs项目实战之可插拔的业务逻辑处理3-38 hdfs replica placement policy3-39 hdfs写数据流程图解3-40 hdfs读数据流程图解3-41 hdfs checkpoint详解3-42 hdfs savemode第4章 分布式计算框架mapreduce本章将从架构、编程模型等角度带大家认识hadoop的分布式计算框架mapreduce.掌握mapreduce各个核心组件编程.并通过两个案例让大家深入掌握mapreduce编程的方方面面。4-1 课程目录4-2 mapreduce概述4-3 mapreduce编程模型详解4-4 mapreduce编程模型核心概念详解4-5 词频统计之自定义mapper实现4-6 词频统计之自定义reducer实现4-7 词频统计之自定义driver类实现4-8 词频统计之本地方式运行4-9 词频统计之通过debug方式进一步了解偏移量以及重构代码4-10 词频统计升级之combiner操作 试看4-11 流量统计实战之需求4-12 流量统计实战之自定义复杂数据类型4-13 流量统计实战之自定义mapper类4-14 流量统计实战之自定义reducer实现4-15 流量统计实战之driver开发4-16 流量统计实战之代码重构及nullwritable的使用4-17 流量统计实战升级之自定义partitioner第5章 资源调度框架yarn本章将从yarn的产生背景、yarn的架构及执行流程的角度带大家认知hadoop的资源调度框架yarn.快速搭建单节点伪分布式yarn的实验环境并掌握如何提交mapreduce作业提交到yarn上运行。5-1 课程目录5-2 yarn产生背景5-3 yarn概述5-4 yarn架构详解5-5 yarn执行流程5-6 yarn环境部署5-7 提交example案例到yarn上运行5-8 提交流量统计案例到yarn上运行第6章 电商项目实战hadoop实现本章将通过电商用户行为日志分析的项目实战.来将前面几个章节讲解的知识点串联起来.综合使用hadoop的技术进行离线统计分析。6-1 课程目录6-2 用户行为日志概述6-3 为什么要记录用户行为日志6-4 日志内容介绍6-5 用户行为日志分析的意义所在6-6 电商常用术语6-7 项目需求描述6-8 数据处理流程及技术架构6-9 浏览量统计功能实现6-10 省份浏览量统计之ip库解析6-11 省份浏览量统计之日志解析6-12 省份浏览量统计之功能实现6-13 页面浏览量统计之页面编号获取6-14 页面浏览量统计之功能实现6-15 数据处理过程中etl的重要性6-16 原始日志etl操作6-17 浏览量统计功能升级6-18 省份浏览量统计功能升级6-19 页面浏览量统计功能升级思路6-20 打包到服务器上运行6-21 项目扩展第7章 数据仓库hive本章将从hive的产生背景、体系架构、hive部署、ddl以及dml来掌握hive使用的方方面面。

4 ~1 r7 ]6 |k3 ^r

7-1 课程目录7-2 hive产生背景7-3 hive是什么7-4 为什么要使用hive7-5 hive在hadoop生态圈中的位置7-6 hive体系架构7-7 hive部署架构7-8 hive与rdbms的区别7-9 hive部署7-10 hive快速入门7-11 hive ddl之数据库操作7-12 hive ddl之表操作7-13 hive dml之加载和导出数据7-14 hive ql基本统计7-15 hive ql之聚合函数7-16 hive ql之分组函数7-17 hive ql之join的使用7-18 hive ql执行计划第8章 电商项目实战hive实现本章将使用hive对电商用户行为日志分析进行重新实现.让大家对mapreduce编程和hive实现的方式进行对比.体会hive在生产上使用的便捷性。8-1 课程目录8-2 外部表在hive中的使用8-3 track_info分区表的创建8-4 将etl的数据加载到hive表8-5 使用hive完成统计分析功能8-6 hive实现项目的方便性体现第9章 hadoop分布式集群搭建本章将带领大家搭建一个三个节点的分布式hadoop集群环境.让大家对于hadoop集群的安装有更深入的认识.并将项目实战案例运行在分布式集群环境中。

” m9 `’ ?* o1 f9 h3 r: x

9-1 课程目录9-2 hadoop集群规划9-3 前置条件安装9-4 jdk安装9-5 hadoop集群部署9-6 提交作业到hadoop集群上运行9-7 课程总结第10章 (彩蛋番外篇)join在mapreduce中的实现本章将从sql中的join入手.详细剖析如何在mapreduce中实现join.这是面试中经常被考察到的点.考察你的mapreduce功底以及优化策略。

! j# n$ y; ~; t. r) t$ z& c

10-1 join概述10-2 reducejoin流程分析10-3 reducejoin功能实现10-4 mapjoin实现原理10-5 mapjoin功能实现

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/232161.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录