图书介绍
数据科学与大数据分析 数据的发现 分析 可视化与表示2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- (美)EMC教育服务团队(EMC Education Services) 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115416377
- 出版时间:2016
- 标注页数:356页
- 文件大小:40MB
- 文件页数:391页
- 主题词:数据处理
PDF下载
下载说明
数据科学与大数据分析 数据的发现 分析 可视化与表示PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 大数据分析介绍1
1.1 大数据概述2
1.1.1 数据结构4
1.1.2 数据存储的分析视角9
1.2 分析的实践状态10
1.2.1 商业智能VS数据科学11
1.2.2 当前分析架构12
1.2.3 大数据的驱动力14
1.2.4 新的大数据生态系统和新的分析方法15
1.3 新的大数据生态系统中的关键角色17
1.4 大数据分析案例20
1.5 总结21
1.6 练习21
参考书目21
第2章 数据分析生命周期23
2.1 数据分析生命周期概述24
2.1.1 一个成功分析项目的关键角色24
2.1.2 数据分析生命周期的背景和概述26
2.2 第1阶段:发现28
2.2.1 学习业务领域29
2.2.2 资源29
2.2.3 设定问题30
2.2.4 确定关键利益相关者30
2.2.5 采访分析发起人31
2.2.6 形成初始假设32
2.2.7 明确潜在数据源32
2.3 第2阶段:数据准备33
2.3.1 准备分析沙箱34
2.3.2 执行ETLT35
2.3.3 研究数据36
2.3.4 数据治理37
2.3.5 调查和可视化37
2.3.6 数据准备阶段的常用工具38
2.4 第3阶段:模型规划39
2.4.1 数据探索和变量选择40
2.4.2 模型的选择41
2.4.3 模型设计阶段的常用工具42
2.5 第4阶段:模型建立42
2.5.1 模型构建阶段中的常用工具44
2.6 第5阶段:沟通结果45
2.7 第6阶段:实施46
2.8 案例研究:全球创新网络和分析(GINA)49
2.8.1 第1阶段:发现50
2.8.2 第2阶段:数据准备51
2.8.3 第3阶段:模型规划51
2.8.4 第4阶段:模型建立51
2.8.5 第5阶段:沟通结果53
2.8.6 第6阶段:实施54
2.9 总结55
2.10 练习55
参考书目55
第3章 使用R进行基本数据分析57
3.1 R简介58
3.1.1 R图形用户界面61
3.1.2 数据导入和导出63
3.1.3 属性和数据类型64
3.1.4 描述性统计(descriptive statistics)72
3.2 探索性数据分析73
3.2.1 在分析之前先可视化74
3.2.2 脏数据77
3.2.3 可视化单个变量80
3.2.4 研究多个变量83
3.2.5 对比数据探索和数据演示90
3.3 用于评估的统计方法92
3.3.1 假设检验93
3.3.2 均值差异94
3.3.3 Wilcoxon秩和检验98
3.3.4 Ⅰ型和Ⅱ型错误99
3.3.5 功效和抽样大小100
3.3.6 ANOVA100
3.4 总结104
3.5 练习104
参考文献105
第4章 高级分析理论与方法:聚类107
4.1 聚类概述108
4.2 k均值聚类108
4.2.1 使用案例109
4.2.2 方法概述110
4.2.3 确定聚类簇的数量112
4.2.4 诊断117
4.2.5 选择原因及注意事项118
4.3 其他算法122
4.4 总结122
4.5 练习123
参考书目123
第5章 高级分析理论与方法:关联规则124
5.1 概述125
5.2 Apriori算法127
5.3 评估候选规则128
5.4 关联规则的应用129
5.5 杂货店交易示例130
5.5.1 杂货店数据集130
5.5.2 生成频繁数据集132
5.5.3 规则的生成和可视化137
5.6 验证和测试143
5.7 诊断143
5.8 总结144
5.9 练习144
参考书目145
第6章 高级分析理论与方法:回归147
6.1 线性回归148
6.1.1 用例148
6.1.2 模型描述149
6.1.3 诊断158
6.2 逻辑回归163
6.2.1 用例163
6.2.2 模型描述163
6.2.3 诊断165
6.3 选择理由和注意事项172
6.4 其他回归模型173
6.5 总结173
6.6 练习174
第7章 高级分析理论与方法:分类175
7.1 决策树176
7.1.1 决策树概览177
7.1.2 通用算法181
7.1.3 决策树算法185
7.1.4 评估决策树186
7.1.5 R中的决策树189
7.2 朴素贝叶斯193
7.2.1 贝叶斯定理194
7.2.2 朴素贝叶斯分类器196
7.2.3 平滑198
7.2.4 诊断198
7.2.5 R中的朴素贝叶斯199
7.3 分类器诊断204
7.4 其他分类方法208
7.5 总结209
7.6 练习210
参考书目210
第8章 高级分析理论与方法:时间序列分析212
8.1 时间序列分析概述213
8.1.1 Box-Jenkins方法214
8.2 ARIMA模型215
8.2.1 自相关函数(ACF)215
8.2.2 自回归模型216
8.2.3 移动平均模型218
8.2.4 ARMA和ARIMA模型219
8.2.5 建立和评估ARIMA模型222
8.2.6 选择理由及注意事项230
8.3 其他方法230
8.4 总结231
8.5 练习231
第9章 高级分析理论与方法:文本分析232
9.1 文本分析步骤234
9.2 一个文本分析的示例235
9.3 收集原始数据237
9.4 表示文本240
9.5 词频-逆文档频率(TFIDF)245
9.6 通过主题来分类文件249
9.7 情感分析253
9.8 获得洞察力258
9.9 总结263
9.10 练习263
参考书目264
第10章 高级分析技术与工具:MapReduce和Hadoop267
10.1 非结构化数据分析268
10.1.1 用例268
10.1.2 MapReduce270
10.1.3 Apache Hadoop271
10.2 Hadoop生态系统277
10.2.1 Pig278
10.2.2 Hive279
10.2.3 HBase282
10.2.4 Mahout290
10.3 NoSQL292
10.4 总结293
10.5 练习294
参考书目294
第11章 高级分析技术与工具:数据库内分析297
11.1 SQL基本要素298
11.1.1 连接299
11.1.2 set运算符301
11.1.3 grouping扩展303
11.2 数据库内的文本分析307
11.3 高级SQL技术311
11.3.1 窗口函数311
11.3.2 用户定义函数与聚合315
11.3.3 排序聚合318
11.3.4 MABlib319
11.4 总结323
11.5 练习323
参考书目323
第12章 结尾324
12.1 沟通和实施一个分析项目325
12.2 创建最终可交付成果327
12.2.1 为多个受众群体创建核心材料329
12.2.2 项目目标330
12.2.3 主要发现331
12.2.4 方法333
12.2.5 模型描述334
12.2.6 有数据支持的关键论点335
12.2.7 模型细节336
12.2.8 建议337
12.2.9 关于最终演示文档的额外提示338
12.2.10 提供技术规范和代码339
12.3 数据可视化基础340
12.3.1 有数据支持的要点341
12.3.2 图的演进342
12.3.3 通用表示方法348
12.3.4 如何清理图形349
12.3.5 额外考虑353
12.4 总结355
12.5 练习355
12.6 参考文献与扩展阅读355
参考书目356
热门推荐
- 286272.html
- 2090331.html
- 3787705.html
- 1099032.html
- 679708.html
- 336577.html
- 2765136.html
- 1342516.html
- 429457.html
- 505160.html
- http://www.ickdjs.cc/book_2686805.html
- http://www.ickdjs.cc/book_1099051.html
- http://www.ickdjs.cc/book_2069459.html
- http://www.ickdjs.cc/book_2907911.html
- http://www.ickdjs.cc/book_2090307.html
- http://www.ickdjs.cc/book_1827177.html
- http://www.ickdjs.cc/book_3852572.html
- http://www.ickdjs.cc/book_3579929.html
- http://www.ickdjs.cc/book_1637571.html
- http://www.ickdjs.cc/book_1103421.html