图书介绍
数据科学2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 朝乐门 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302436992
- 出版时间:2016
- 标注页数:323页
- 文件大小:89MB
- 文件页数:337页
- 主题词:
PDF下载
下载说明
数据科学PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 基础理论1
1.1 数据3
1.1.1 数据模型5
1.1.2 数据维度7
1.2 大数据9
1.2.1 内涵与特征10
1.2.2 大数据时代的新理念12
1.2.3 大数据时代的新术语16
1.3 数据科学概述20
1.3.1 研究目的22
1.3.2 理论基础24
1.3.3 研究内容25
1.3.4 基本流程27
1.3.5 主要原则28
1.3.6 典型应用29
1.4 数据科学家30
1.4.1 主要任务30
1.4.2 能力要求30
1.4.3 常用工具31
1.4.4 团队工作32
1.5 数据科学项目33
1.5.1 角色定义33
1.5.2 基本流程34
1.6 应用案例35
小结41
习题42
参考文献及扩展阅读资料42
第2章 数据预处理45
2.1 数据质量48
2.1.1 统计学规律50
2.1.2 语言学规律51
2.1.3 数据连续性理论52
2.1.4 数据鉴别技术54
2.1.5 探索性数据分析57
2.2 数据审计60
2.2.1 预定义审计60
2.2.2 自定义审计61
2.2.3 可视化审计61
2.3 数据清洗62
2.3.1 缺失数据处理63
2.3.2 冗余数据处理64
2.3.3 噪声数据处理65
2.4 数据变换68
2.4.1 大小变换69
2.4.2 类型变换70
2.5 数据集成71
2.5.1 基本类型71
2.5.2 主要问题72
2.6 其他预处理方法74
2.6.1 数据脱敏74
2.6.2 数据归约75
2.6.3 数据标注76
2.7 应用案例76
小结87
习题87
参考文献及扩展阅读资料88
第3章 数据统计90
3.1 概率分布93
3.1.1 正态分布95
3.1.2 卡方分布97
3.1.3 t分布97
3.1.4 F分布98
3.2 参数估计98
3.2.1 点估计99
3.2.2 区间估计99
3.3 假设检验101
3.3.1 参数检验103
3.3.2 非参数检验104
3.4 基本分析方法105
3.4.1 相关分析106
3.4.2 回归分析108
3.4.3 方差分析111
3.4.4 分类分析112
3.4.5 聚类分析114
3.4.6 时间序列分析115
3.4.7 其他方法116
3.5 元分析方法118
3.5.1 加权平均法118
3.5.2 优化方法119
3.6 应用案例120
小结126
习题127
参考文献及扩展阅读资料128
第4章 机器学习129
4.1 基本概念133
4.1.1 定义133
4.1.2 应用134
4.2 机器学习活动135
4.2.1 训练经验的选择135
4.2.2 目标函数的选择136
4.2.3 目标函数的表示138
4.2.4 函数逼近算法的选择139
4.3 机器学习系统141
4.3.1 执行器141
4.3.2 评价器142
4.3.3 泛化器143
4.3.4 实验生成器143
4.4 主要类型143
4.4.1 基于实例学习144
4.4.2 概念学习144
4.4.3 决策树学习147
4.4.4 人工神经网络学习148
4.4.5 贝叶斯学习151
4.4.6 遗传算法152
4.4.7 分析学习154
4.4.8 增强学习159
4.5 典型算法160
4.5.1 K-Means算法161
4.5.2 KNN算法162
4.5.3 ID3算法164
4.6 应用案例167
小结176
习题177
参考文献及扩展阅读资料178
第5章 数据可视化179
5.1 主要类型184
5.1.1 科学可视化184
5.1.2 信息可视化185
5.1.3 可视分析学186
5.2 基本模型187
5.2.1 顺序模型187
5.2.2 循环模型187
5.2.3 分析模型188
5.3 常用方法190
5.3.1 视觉编码191
5.3.2 统计图表193
5.3.3 图论方法198
5.3.4 视觉隐喻200
5.3.5 图形符号学202
5.3.6 面向领域的方法203
5.4 视觉编码205
5.4.1 视觉感知205
5.4.2 数据类型206
5.4.3 视觉通道207
5.4.4 视觉假象210
5.5 评价与改进211
5.5.1 测评原则211
5.5.2 测评流程212
5.5.3 测评方法213
5.6 应用案例213
小结218
习题220
参考文献及扩展阅读资料220
第6章 数据计算222
6.1 计算模式的演变224
6.1.1 集中式计算225
6.1.2 分布式计算225
6.1.3 网格计算227
6.1.4 云计算227
6.2 主流计算框架——MapReduce229
6.2.1 基本思想230
6.2.2 实现过程232
6.2.3 主要特征233
6.2.4 关键技术236
6.5.5 下一代MapReduce238
6.3 主流计算平台——Hadoop MapReduce240
6.3.1 数据流240
6.3.2 任务处理242
6.3.3 技术实现244
6.3.4 YARN247
6.4 其他相关计算系统——Hadoop生态系统249
6.4.1 HDFS251
6.4.2 Hive251
6.4.3 Pig252
6.4.4 Mahout253
6.4.5 HBase254
6.4.6 ZooKeeper254
6.4.7 Flume256
6.4.8 Sqoop257
6.5 应用案例258
小结261
习题262
参考文献及扩展阅读资料262
第7章 数据管理264
7.1 基本类型267
7.1.1 关系数据库268
7.1.2 NoSQL271
7.1.3 关系云273
7.2 体系结构273
7.2.1 Master-Slave结构275
7.2.2 P2P结构276
7.3 关键技术278
7.3.1 数据模型278
7.3.2 数据分布282
7.3.3 数据一致性285
7.3.4 CAP理论与BASE原则287
7.3.5 视图与物化视图288
7.3.6 事务与版本戳289
7.4 典型系统291
7.4.1 Memcached291
7.4.2 MongoDB294
7.4.3 Cassandra296
7.4.4 HBase298
7.5 应用案例301
小结304
习题307
参考文献及扩展阅读资料307
附录A R语言与R软件309
附录B 术语索引318
热门推荐
- 450775.html
- 3344040.html
- 1627648.html
- 1323347.html
- 2598096.html
- 315945.html
- 2740058.html
- 272613.html
- 1821717.html
- 2264532.html
- http://www.ickdjs.cc/book_1112479.html
- http://www.ickdjs.cc/book_1616628.html
- http://www.ickdjs.cc/book_289432.html
- http://www.ickdjs.cc/book_2591677.html
- http://www.ickdjs.cc/book_2708688.html
- http://www.ickdjs.cc/book_3480539.html
- http://www.ickdjs.cc/book_535336.html
- http://www.ickdjs.cc/book_137000.html
- http://www.ickdjs.cc/book_2940070.html
- http://www.ickdjs.cc/book_1322112.html