图书介绍
数据挖掘与机器学习2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 吴建生,许桂秋主编 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115503527
- 出版时间:2019
- 标注页数:170页
- 文件大小:77MB
- 文件页数:181页
- 主题词:数据采集-教材;机器学习-教材
PDF下载
下载说明
数据挖掘与机器学习PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘概述1
1.1 数据分析技术发展简介1
1.1.1 数据时代1
1.1.2 数据分析技术的发展2
1.2 数据挖掘的概念5
1.2.1 数据挖掘的定义与OLAP5
1.2.2 数据挖掘与知识发现6
1.3 数据挖掘的功能与应用领域10
1.3.1 电子商务10
1.3.2 电信行业10
1.3.3 金融行业11
1.3.4 医疗行业11
1.3.5 社会网络12
1.3.6 数据挖掘应用面临的问题12
1.4 数据挖掘的模型13
1.4.1 类/概念描述13
1.4.2 回归14
1.4.3 分类15
1.4.4 预测16
1.4.5 关联16
1.4.6 聚类17
1.4.7 异常检测18
1.5 数据挖掘的数据类型19
1.5.1 数据库19
1.5.2 数据仓库20
1.5.3 其他数据类型21
1.6 数据挖掘的交叉学科22
1.6.1 统计学22
1.6.2 机器学习23
1.6.3 数据库与数据仓库23
第2章 Pandas数据分析24
2.1 Pandas与数据分析24
2.1.1 统计学与数据挖掘24
2.1.2 常用的统计学指标25
2.1.3 Pandas的简单介绍27
2.2 Pandas统计案例分析31
2.2.1 实现Pandas自行车行驶数据分析31
2.2.2 实现Pandas服务热线数据分析38
第3章 机器学习43
3.1 数据挖掘中的机器学习43
3.1.1 机器学习的含义43
3.1.2 机器学习处理的问题44
3.1.3 机器学习的框架44
3.1.4 数据的加载和分割46
3.2 机器学习的模型47
3.2.1 模型的选择47
3.2.2 学习和预测48
3.2.3 实现机器学习模型48
3.3 模型的评判和保存49
3.3.1 分类、回归、聚类不同的评判指标49
3.3.2 交叉验证50
3.3.3 实现分类、回归指标51
3.3.4 实现cross_val_score52
3.3.5 实现模型的保存53
3.4 支持向量机54
3.4.1 支持向量机概述54
3.4.2 实现支持向量机分类55
3.4.3 实现支持向量机回归56
3.4.4 实现支持向量机异常检测56
3.5 过拟合问题58
3.5.1 过拟合58
3.5.2 实现学习曲线和验证曲线60
第4章 分类算法与应用63
4.1 数据挖掘分类问题63
4.2 概率模型64
4.2.1 原理64
4.2.2 应用场景67
4.3 朴素贝叶斯分类67
4.3.1 原理与应用场景67
4.3.2 实现朴素贝叶斯算法68
4.4 向量空间模型69
4.4.1 原理与应用场景69
4.4.2 实现空间向量模型70
4.5 KNN算法73
4.5.1 原理与应用场景73
4.5.2 实现KNN算法75
4.6 多类问题77
4.6.1 原理与应用场景77
4.6.2 实现多类问题79
第5章 回归算法与应用82
5.1 回归预测问题82
5.2 线性回归84
5.2.1 原理与应用场景84
5.2.2 实现线性回归85
5.3 岭回归和Lasso回归87
5.3.1 原理与应用场景87
5.3.2 实现岭回归90
5.4 逻辑回归92
5.4.1 原理与应用场景92
5.4.2 实现逻辑回归94
第6章 无监督学习97
6.1 无监督学习问题97
6.1.1 无监督学习的概念97
6.1.2 聚类分析的基本概念与原理98
6.1.3 降维的基本概念与原理98
6.14 聚类的框架99
6.2 划分聚类100
6.2.1 划分聚类的基本概念100
6.2.2 K-Means算法100
6.2.3 实现K-Means算法103
6.3 层次聚类106
6.3.1 层次聚类算法106
6.3.2 实现层次聚类算法108
6.4 聚类效果评测109
6.5 降维111
6.5.1 降维算法111
6.5.2 实现降维111
第7章 关联规则和协同过滤114
7.1 关联规则114
7.1.1 关联规则的概念114
7.1.2 关联规则的挖掘过程115
7.2 Apriori算法116
7.2.1 Apriori算法的概念116
7.2.2 Apriori算法的实现原理116
7.2.3 Apriori算法的实现118
7.3 协同过滤122
7.3.1 协同过滤的概念122
7.3.2 协同过滤的实现127
第8章 图像数据分析133
8.1 图像数据的相关概念133
8.2 图像数据分析方法135
8.3 图像数据分析案例137
8.3.1 Python图像处理类库应用示例137
8.3.2 NumPy图像数据分析示例143
8.3.3 SciPy图像数据分析示例146
8.3.4 Scikit-image的特征提取模块149
8.3.5 综合练习154
第9章 自然语言处理与NLTK155
9.1 自然语言处理概述155
9.2 NLTK入门基础156
9.2.1 Python的第三方模块——NLTK156
9.2.2 实现词条化157
9.2.3 实现词千还原158
9.2.4 实现词形归并159
9.2.5 实现文本划分160
9.2.6 实现数值型数据的转换161
9.3 NLTK文本分析164
9.3.1 实现文本分类器164
9.3.2 实现性别判断166
9.3.3 实现情感分析167