图书介绍

数据挖掘 你必须知道的32个经典案例 第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据挖掘 你必须知道的32个经典案例 第2版
  • 任昱衡 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121351129
  • 出版时间:2018
  • 标注页数:274页
  • 文件大小:31MB
  • 文件页数:290页
  • 主题词:商业信息-数据采集-案例

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘 你必须知道的32个经典案例 第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 经典的探索性数据分析案例1

1.1 探索性数据分析综述2

1.1.1 什么是探索性数据分析2

1.1.2 如何收集数据4

1.1.3 数据预处理技术5

1.2 数据巧收集——红牛的大数据营销案例8

1.2.1 状况百出的红牛企业8

1.2.2 红牛企业巧妙收集消费者数据9

1.2.3 数据收集小结12

1.3 数据可视化——数据新闻促使英军撤军13

1.3.1 维基解密带来的海量数据13

1.3.2 百花齐放的数据新闻15

1.3.3 数据可视化小结18

1.4 异常值分析——Facebook消灭钓鱼链接19

1.4.1 Facebook和广告商之间的拉锯战20

1.4.2 异常值分析指导排名算法工作22

1.4.3 异常值分析小结26

1.5 对比分析——TrueCar指导购物者寻找最合算的车价27

1.5.1 火中取栗的TrueCar网站28

1.5.2 数据对比赢得消费者信赖29

1.5.3 对比分析小结32

第2章 经典的相关分析与回归分析案例35

2.1 相关回归综述36

2.1.1 相关回归简介36

2.1.2 相关性分析的发展介绍38

2.1.3 回归分析的发展介绍39

2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑40

2.2.1 简约而不简单的消防检测系统40

2.2.2 使用相关分析洞察60个变量的关系42

2.2.3 相关分析小结45

2.3 时间序列分析——人寿保险的可提费用预测47

2.3.1 人寿保险公司和可提费用47

2.3.2 使用4种时间序列回归预测模型解决问题49

2.3.3 时间序列分析小结52

2.4 线性回归分析——梅西百货公司的12项大数据策略54

2.4.1 从“一亿豪赌”说起的零售商困境54

2.4.2 SAS公司帮助梅西百货构建模型56

2.4.3 线性回归分析小结59

2.5 Logistic回归分析——大面积流感爆发的预测分析62

2.5.1 究竟谁才是流感预测算法之王62

2.5.2 向Logistic算法中引入更多变量64

2.5.3 Logistic回归分析小结67

第3章 经典的降维数据分析案例69

3.1 降维算法综述70

3.1.1 为什么要使用降维算法70

3.1.2 线性降维算法72

3.1.3 非线性降维算法73

3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策74

3.2.1 银行信贷政策的制定原则75

3.2.2 粗糙集算法的原理和应用76

3.2.3 粗糙集算法小结80

3.3 因子分析——基于李克特量表的应聘评价法82

3.3.1 源于智力测试的因子分析82

3.3.2 使用因子分析解构问卷84

3.3.3 因子分析小结87

3.4 最优尺度分析——直观评估消费者倾向的分析方法89

3.4.1 市场调查问题催生的最优尺度分析89

3.4.2 6种经典的最优尺度分析解读方法91

3.4.3 最优尺度分析小结95

3.5 PCA降维算法——智能人脸识别的应用与拓展97

3.5.1 刷脸的时代来了97

3.5.2 使用PCA降维算法完成降维工作99

3.5.3 PCA降维算法小结102

第4章 经典的模式识别案例105

4.1 模式识别综述106

4.1.1 模式识别简介106

4.1.2 模式识别的发展脉络107

4.1.3 模式识别应用简介110

4.2 图像分析——谷歌的超前自动驾驶技术111

4.2.1 以安全的名义呼吁自动驾驶技术111

4.2.2 快速成熟的无人驾驶技术113

4.2.3 图像分析小结116

4.3 遗传算法——经典的人力资源优化问题118

4.3.1 使用有限资源实现利益最大化118

4.3.2 遗传算法的计算过程120

4.3.3 遗传算法小结123

4.4 决策树分析——“沸腾时刻”准确判断用户健康水平124

4.4.1 打造我国最大的健身平台124

4.4.2 信息增益和决策树126

4.4.3 决策树小结129

4.5 K均值聚类分析——HSE24通过为客户分类降低退货率131

4.5.1 在电子商务市场快速扩张的HSE24131

4.5.2 使用K均值聚类为客户分类133

4.5.3 K均值聚类小结136

第5章 经典的机器学习案例139

5.1 机器学习综述140

5.1.1 机器学习简介140

5.1.2 机器学习的主流发展和应用142

5.2 语义搜索——沃尔玛搜索引擎提升15%销售额143

5.2.1 注重用户体验的沃尔玛公司144

5.2.2 语义搜索引擎的底层技术和原理145

5.2.3 语义搜索技术小结148

5.3 顺序分析——搜狗输入法的智能纠错系统150

5.3.1 搜狗输入法的王牌词库和智能算法151

5.3.2 频繁树模式和顺序分析算法153

5.3.3 顺序分析小结156

5.4 文本分析——经典的垃圾邮件过滤系统158

5.4.1 大数据时代需要文本分析工作158

5.4.2 垃圾邮件过滤中的分词技术和词集模型160

5.4.3 文本分析小结163

5.5 协同过滤——构建个性化推荐系统的经典算法164

5.5.1 协同过滤算法为什么这么流行165

5.5.2 基于用户和基于产品的协同过滤166

5.5.3 协同过滤算法小结169

第6章 经典的深度学习案例171

6.1 深度学习综述172

6.1.1 深度学习简介172

6.1.2 深度学习在图像处理方面的应用174

6.1.3 深度学习在自然语言处理方面的应用176

6.2 支持向量机——乔布斯利用大数据对抗癌症178

6.2.1 乔布斯和胰腺癌的抗争178

6.2.2 医学统计学和支持向量机180

6.2.3 支持向量机小结184

6.3 感知器神经网络——最佳的房产价格预测算法185

6.3.1 如何预测房价186

6.3.2 多层感知器和误差曲面188

6.3.3 感知器神经网络小结191

6.4 自组织神经网络——如何又快又好地解决旅行商问题193

6.4.1 最优路径问题的典型模式和解决方法193

6.4.2 自组织神经网络的拓扑结构和权值调整194

6.4.3 自组织神经网络小结198

6.5 RBM算法——为新闻报道智能分类199

6.5.1 新闻报道智能分类的难与易199

6.5.2 RBM算法的学习目标和学习方法201

6.5.3 RBM算法小结204

第7章 经典的数据挖掘案例207

7.1 数据挖掘综述208

7.1.1 什么是数据挖掘208

7.1.2 数据挖掘的主要应用领域209

7.1.3 数据挖掘模型的评价指标211

7.2 判别分析——美国运通构建客户流失预测模型213

7.2.1 美国运通公司的旧日辉煌213

7.2.2 判别分析的假设条件和判别函数214

7.2.3 判别分析小结218

7.3 购物篮分析——找出零售业的最佳商品组合220

7.3.1 名动天下的“啤酒和尿布”案例220

7.3.2 购物篮分析的频繁模式222

7.3.3 购物篮分析小结225

7.4 马尔可夫链——准确预测客运市场占有率227

7.4.1 复杂的客运市场系统227

7.4.2 概率转移矩阵的求解方法229

7.4.3 马尔可夫链小结232

7.5 AdaBoost元算法——有效侦测欺诈交易的复合算法233

7.5.1 弱分类器和强分类器之争233

7.5.2 AdaBoost元算法的分类器构建方法235

7.5.3 AdaBoost元算法小结238

第8章 经典的商业智能分析案例241

8.1 商业智能分析综述242

8.1.1 什么是商业智能242

8.1.2 商业智能的主流发展与应用244

8.2 KXEN分析软件——构建欧洲博彩业下注预测平台246

8.2.1 现代博彩业背后的黑手247

8.2.2 集体智慧和庄家赔率的联系248

8.2.3 KXEN软件小结252

8.3 数据废气再利用——物流公司数据成功用于评估客户信用253

8.3.1 数据废气和黑暗数据的异同254

8.3.2 论如何充分利用物流公司数据255

8.3.3 数据废气再利用小结258

8.4 必应预测——使用往期信息预测自然灾害259

8.4.1 预测自然灾害的必要性260

8.4.2 微软大数据预测的优与劣261

8.4.3 必应预测小结263

8.5 点球成金——助力NBA大数据分析的多种神秘软件265

8.5.1 NBA的有效球员数据265

8.5.2 有关点球成金的靠谱方法268

8.5.3 点球成金小结270

热门推荐