课程介绍
课程目录
练习
考试
用户评价 ({{replyData.whole}})
课程大纲
初识大数据
课时目标:
了解大数据的定义、应用场景、分析流程和工作岗位需求,展示大数据在不同行业的应用进展和趋势。包括医疗大数据、旅游大数据,以及华为公司的两个案例。
1.1 大数据定义
1.2 大数据应用场景
1.3 大数据分析流程
1.4 如何参与大数据分析
1.5 大数据应用纵览
1.6 智能医疗大数据
1.7 旅游大数据案例
1.8 金融科技与大数据风控
1.9 政务最多跑一次
Python大数据基础(一)
课时目标:
介绍Python的基本数据类型和数据结构,Numpy和Pandas的使用方法,以及本课程所使用的在线实践平台。
2.1 内置数据类型
2.2 扩展数据类型
2.3 内置数据结构
2.4 Ndarray介绍
2.5 Series介绍
2.6 DataFrame介绍
2.7 在线实验平台介绍
2.8 旅游大数据在线实验
2.9 数据类型和结构在线实验
Python大数据基础(二)
课时目标:
介绍使用Python进行数据读取、数据转换、数据交换和数据展示等相关内容。
3.1 文件读写
3.2 文件和文件夹处理
3.3 数据库存取
3.4 CSV和Excel数据交换
3.5 JSON和XML数据交换
3.6 Web数据交换
3.7 用pandas加工数据
3.8 用Matplotlib展示数据
3.9 数据加工和展示在线实验
数据分析方法(一)
课时目标:
学习并掌握统计数据分析,主要包括数据的中心趋势度量、 数据的离散程度度量、数据分布的度量和图形化分析方法。
4.1 数据分析方法概述
4.2 统计数据分析方法
4.3 数据的中心趋势度量
4.4 数据的离散程度度量
4.5 数据分布的度量
4.6 图形化分析方法
数据分析方法(二)
课时目标:
学习并掌握基于机器学习的数据分析方法,主要包括机器学习的典型任务,常见的有监督学习和无监督学习算法。
5.1 机器学习简介
5.2 机器学习的典型任务
5.3 决策树算法
5.4 K-近邻分类算法(KNN算法)
5.5 K-均值聚类算法(K-means算法)
5.6 Apriori关联规则算法
5.7 在线实验
开源平台和工具(一)
课时目标:
介绍数据获取、清洗与存储等相关的开源平台和工具
6.1 数据采集与清洗概述
6.2 日志数据采集Flume简介
6.3 数据分发中间件Kafka简介
6.4 HDFS介绍及使用方法
6.5 HBase介绍及使用方法
6.6 Hive介绍及使用方法
6.7 NoSQL数据库技术
6.8 openLooKeng及使用简介
开源平台和工具(二)
课时目标:
介绍批处理、流式数据处理与分析以及资源管理与调度的开源平台和工具
7.1 批处理:MapReduce
7.2 批处理:Spark
7.3 PageRank举例
7.4 流处理:Storm
7.5 流处理:Spark Streaming
7.6 资源管理与调度概述
7.7 Zookeeper介绍及使用方法
7.8 在线实验
数据可视化和综合实践
课时目标:
介绍数据可视化的基本方法和技术,以旅游大数据为例展示大数据分析的流程和方法。
8.1 数据可视化简介
8.2 高维数据可视化
8.3 网络和层次化数据可视化
8.4 时空数据可视化
8.5 文本数据可视化
8.6 可视化在线实验
8.7 课程结业考核
  • {{ item.title }}
    {{ item.answer }}人已答题
    答题
上传图片
发表评价
综合评分: {{ replyData.score }}
{{item.nickname}}
{{item.add_time}}
{{item.comment}}
官方回复:
{{item.merchant_reply_content}}
扫码联系
电话联系