图书介绍

CDA数据分析师系列丛书 SPSS Modeler+Weka数据挖掘从入门到实战2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

CDA数据分析师系列丛书 SPSS Modeler+Weka数据挖掘从入门到实战
  • 经管之家主编 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121319112
  • 出版时间:2019
  • 标注页数:268页
  • 文件大小:75MB
  • 文件页数:282页
  • 主题词:统计分析-应用软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

CDA数据分析师系列丛书 SPSS Modeler+Weka数据挖掘从入门到实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1篇 理论篇1

第1章 数据挖掘简介1

1.1 数据挖掘的起源、定义及目标2

1.2 数据挖掘的发展历程2

1.3 SPSS Modeler和Weka基础操作4

1.3.1 SPSS Modeler软件简介4

1.3.2 建立一个SPSS Modeler项目5

1.3.3 Weka软件环境简介8

1.3.4 Weka简单操作实例9

第2章 数据挖掘方法论15

2.1 数据挖掘方法论16

2.1.1 CRISP-DM16

2.1.2 SEMMA16

2.2 数据库中的知识挖掘步骤17

2.2.1 字段选择17

2.2.2 数据清洗18

2.2.3 字段扩充18

2.2.4 数据编码19

2.2.5 数据挖掘20

2.2.6 结果呈现21

2.3 案例:运用SPSS Modeler和Weka做客户的信用风险评分模型22

2.3.1 案例说明22

2.3.2 案例实操23

2.3.3 运用SPSS Modeler进行初步的数据挖掘28

2.3.4 运用Weka进行数据汇入34

2.3.5 Weka自有数据存储格式arff简介36

第3章 基本的数据挖掘技术38

3.1 描述性统计39

3.1.1 案例:通过数据判断客户是否需要新增电话线路39

3.1.2 案例:运用描述性统计分析杂志社的客户特征40

3.2 可视化技术42

3.3 KNN原理及实例44

3.3.1 KNN(K最近邻)算法44

3.3.2 使用KNN算法计算距离45

3.3.3 案例:使用KNN算法向用户推荐电影49

3.4 案例:运用Weka的KNN算法对诊断结果进行预测52

3.4.1 案例说明52

3.4.2 运用Weka中的IBk模型进行预测53

3.5 案例:运用SPSS Modeler的KNN算法预测客户是否接受人寿保险推销58

3.5.1 案例说明58

3.5.2 案例实操59

第4章 数据挖掘进阶技术68

4.1 数据挖掘的功能分类69

4.1.1 描述型数据挖掘(无监督数据挖掘)69

4.1.2 预测型数据挖掘(有监督数据挖掘)70

4.2 数据挖掘的绩效增益72

4.2.1 数据挖掘模型评估指标:正确率、响应率、查全率、F值72

4.2.2 数据挖掘模型评估指标:Gain Chart74

4.2.3 数据挖掘模型评估指标:Lift Chart75

4.2.4 数据挖掘模型评估指标:Profit Chart76

4.3 数据挖掘网站77

4.3.1 KDnuggets77

4.3.2 Kaggle80

4.4 案例:评估新产品的促销活动效果82

4.4.1 案例说明83

4.4.2 数据及字段描述83

4.4.3 效能评估方式85

4.4.4 比赛结果排名85

第2篇 准备篇87

第5章 数据预处理87

5.1 字段选择88

5.1.1 数据整合88

5.1.2 数据过滤88

5.1.3 案例:运用SPSS Modeler过滤数据89

5.2 数据清洗92

5.2.1 错误值的检测及处理92

5.2.2 案例:运用SPSS Modeler进行错误值的检测及处理92

5.2.3 离群值的检测及处理96

5.2.4 案例:运用SPSS Modeler进行离群值的检测及处理96

5.2.5 缺失值的检测及处理100

5.2.6 案例:运用SPSS Modeler进行缺失值的检测及处理101

5.3 字段扩充110

5.3.1 案例说明110

5.3.2 案例:运用SPSS Modeler进行字段扩充及评估对效能的提升111

5.4 数据编码118

5.4.1 数据转换118

5.4.2 数据精简128

5.4.3 数据集的切割129

第6章 关键变量挖掘技术137

6.1 无效变量138

6.2 统计方式的变量选择138

6.2.1 卡方检验138

6.2.2 方差分析(ANOVA检验)及t检验138

6.2.3 案例:运用SPSS Modeler进行关键变量挖掘139

6.3 模型方式的变量选择141

6.3.1 决策树141

6.3.2 Logistic回归141

第7章 贝叶斯网络143

7.1 朴素贝叶斯144

7.1.1 独立性假设145

7.1.2 概率的离散化147

7.2 什么是贝叶斯网络147

第8章 线性回归150

8.1 简单线性回归151

8.2 多元回归152

8.3 相关系数152

8.4 回归分析案例153

8.5 线性回归模型评估156

8.5.1 线性回归模型评估指标:MAE、MSE和RMSE156

8.5.2 线性回归模型评估指标:R2156

8.6 案例:运用SPSS Modeler建立线性回归模型157

8.6.1 案例说明157

8.6.2 案例实操157

第9章 决策树161

9.1 ID3决策树模型162

9.2 ID3算法165

9.2.1 ID3算法的字段选择方式165

9.2.2 使用决策树进行分类168

9.2.3 决策树与决策规则之间的关系168

9.2.4 ID3算法的缺点169

9.3 C5.0算法170

9.3.1 C5.0算法的字段选择方式170

9.3.2 C5.0算法的数值型字段处理方式170

9.3.3 C5.0算法的剪枝方法172

9.4 CART算法173

9.4.1 分类树与回归树174

9.4.2 CART分类树的字段选择方式174

9.4.3 CART分类树的剪枝作法177

9.5 CHAID算法177

9.6 案例:运用SPSS Modeler和Weka建立决策树模型177

9.6.1 案例说明177

9.6.2 案例实操178

9.6.3 运用SPSS Modeler建立交互式分类树模型179

9.6.4 运用Weka建立交互式分类树模型180

9.7 CART回归树算法186

9.7.1 CART回归树的字段选择方式186

9.7.2 利用模型树提升CART回归树的效率187

9.8 案例:运用SPSS Modeler和Weka建立回归树模型188

9.8.1 案例说明188

9.8.2 案例实操188

9.8.3 使用Weka对比“剪枝”前后的模型189

第10章 神经网络194

10.1 BP神经网络模型195

10.1.1 BP神经网络模型的概念195

10.1.2 BP神经网络模型的架构方式195

10.2 神经元的组成198

10.3 神经网络模型如何传递信息199

10.4 修正神经网络模型的权重值及常数项200

10.5 BP神经网络模型与Logistic回归、线性回归及非线性回归之间的关系201

10.6 案例:运用SPSS Modeler建立类神经网络模型202

第11章 Logistic回归208

11.1 Logistic回归与BP神经网络的关系210

11.2 Logistic回归的字段选择方式211

11.2.1 前向法211

11.2.2 后向法212

11.2.3 逐步法212

11.3 案例:运用SPSS Modeler建立Logistic回归模型213

11.3.1 案例说明213

11.3.2 案例实操213

第12章 支持向量机215

12.1 数据是线性可分的支持向量机217

12.2 数据是线性不可分的支持向量机219

12.3 案例:运用SPSS Modeler建立SVM模型221

第3篇 关系篇230

第13章 聚类分析230

13.1 相似性度量232

13.1.1 二元变量的相似性度量232

13.1.2 类别型变量的相似性度量234

13.1.3 数值型变量的相似性度量234

13.2 聚类算法234

13.2.1 互斥聚类与非互斥聚类算法234

13.2.2 分层聚类算法235

13.2.3 分割式聚类算法236

13.3 分层聚类算法236

13.3.1 单一连接法236

13.3.2 完全连接法237

13.3.3 平均连接法238

13.3.4 中心法238

13.3.5 Ward's法(华德法)239

13.4 分割式聚类算法240

13.4.1 K-Means算法240

13.4.2 K-Medoids算法243

13.4.3 SOM算法243

13.4.4 两步法243

13.5 集群判断244

13.5.1 集群判断方法:R2244

13.5.2 集群判断方法:半径R2245

13.5.3 集群判断方法:均方根标准差(RMSSTD)245

13.6 案例:运用SPSS Modeler建立聚类模型246

13.6.1 案例说明246

13.6.2 案例实操246

第14章 关联规则252

14.1 关联规则的概念253

14.2 关联规则的评估指标253

14.2.1 支持度253

14.2.2 置信度254

14.3 Apriori算法254

14.3.1 暴力法的问题254

14.3.2 Apriori算法的理论基础255

14.4 Apriori算法实例说明255

14.4.1 候选项目组合的产生255

14.4.2 候选项目组合的删除256

14.5 再谈评估指标256

14.5.1 支持度与置信度的问题256

14.5.2 提升度指标257

14.6 关联规则的延伸257

14.6.1 虚拟商品的加入257

14.6.2 负向关联规则257

14.7 案例:运用SPSS Modeler建立关联规则模型258

14.7.1 案例说明258

14.7.2 案例实操258

第15章 序列模型263

15.1 序列模型的概念264

15.2 案例:运用SPSS Modeler建立序列模型266

15.2.1 案例说明266

15.2.2 案例实操266

热门推荐