数据挖掘
数据挖掘
6万+ 人选课
更新日期:2025/05/19
开课时间2025/02/16 - 2025/07/27
课程周期23 周
开课状态开课中
每周学时-
课程简介
  • 课程背景

1.数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,应用广泛,是业界所需;

2.数据挖掘集合了概率统计、机器学习、人工智能、数据可视化、算法等等多门计算机领域核心知识,是信息技术研究的重要领域;

3.掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。

  • 课程目标

1.认识数据的统计特性,了解数据的可视化方法,把握数据相似性计算;

2.掌握数据预处理的四大步骤及方法;

3.掌握分类、聚类、回归、关联规则挖掘等核心技术;

4.了解具体数据挖掘的处理过程。

  • 课程设计原则

1.紧跟技术前沿,内容涉及最新的业界技术和前沿研究;

2.注重技术实践,将经典案例融入到数据挖掘课程教学中,提高课程学以致用的效果;

3.重视基础知识,将数据挖掘知识与概率统计、机器学习、算法等底层核心知识融会贯通。

课程大纲
绪论
1.1绪论
1.2章节测试
认识数据
2.1数据类型和统计
2.2数据可视化
2.3数据相似性
2.4章节测试
数据预处理
3.1数据清洗
3.2数据集成
3.3数据规约
3.4数据转换
3.5章节测试
贝叶斯分类
4.1贝叶斯分类基本概念
4.2贝叶斯分类案例
4.3章节测试
决策树分类
5.1决策树基本概念
5.2决策树构建方法
5.3决策树分类案例
5.4章节测试
k-均值聚类
6.1k-均值聚类基本方法
6.2k-均值聚类案例
6.3章节测试
逻辑回归
7.1逻辑回归基本原理
7.2逻辑回归正则化
7.3章节测试
关联规则挖掘
8.1关联规则挖掘概念与基本算法
8.2Apriori算法
8.3FPGrowth算法
8.4规则挖掘
8.5章节测试
数据挖掘实践
9.1初始数据挖掘实践
9.1.1分类实践任务起点
9.1.2初始数据之特征选择
9.2数据预处理实践
9.2.1数据预处理之清洗
9.2.2数据预处理之转换
9.2.3数据预处理之降维
9.3数据挖掘基础算法实践
9.3.1回归预测实践
9.3.2数值预测时间特征扩展实践
9.3.3不平衡分类实践
9.3.4聚类算法实践
9.3.5KNN分类实践
9.4章节测试
支持向量机分类
10.1支持向量机数学原理
10.2支持向量机扩展
10.3章节测试
神经网络分类
11.1神经网络基础概念
11.2神经网络数学原理
11.3章节测试
集成学习
12.1Bagging分类
12.2随机森林分类
12.3.1Boosting分类基础
12.3.2Boosting分类理论
12.4GBDT学习
12.5章节测试