图书介绍

实用数据分析2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

实用数据分析
  • (美)HectorCuesta著;刁晓纯陈堰平译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111476238
  • 出版时间:2014
  • 标注页数:232页
  • 文件大小:30MB
  • 文件页数:250页
  • 主题词:统计数据-统计分析

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

实用数据分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 开始1

1.1 计算机科学1

1.2 人工智能1

1.3 机器学习2

1.4 统计学2

1.5 数学2

1.6 专业领域知识2

1.7 数据、信息和知识3

1.8 数据的本质3

1.9 数据分析过程4

1.9.1 问题5

1.9.2 数据准备5

1.9.3 数据探索5

1.9.4 预测建模6

1.9.5 结果可视化6

1.10 定量与定性数据分析7

1.11 数据可视化的重要性7

1.12 大数据8

1.12.1 传感器和摄像头9

1.12.2 社会化网络分析10

1.12.3 本书的工具和练习11

1.12.4 为什么使用Python11

1.12.5 为什么使用mlpy11

1.12.6 为什么使用D3.js12

1.12.7 为什么使用MongoDB12

1.13 小结12

第2章 数据准备与处理13

2.1 数据源13

2.1.1 开源数据14

2.1.2 文本文件14

2.1.3 Excel文件15

2.1.4 SQL数据库15

2.1.5 NoSQL数据库16

2.1.6 多媒体17

2.1.7 网页检索17

2.2 数据清洗19

2.2.1 统计方法20

2.2.2 文本解析20

2.2.3 数据转化21

2.3 数据格式22

2.3.1 CSV22

2.3.2 JSON24

2.3.3 XML25

2.3.4 YAML26

2.4 开始使用OpenRefine工具27

2.4.1 Textfacet27

2.4.2 聚类27

2.4.3 文件过滤器28

2.4.4 numeric facet29

2.4.5 数据转化29

2.4.6 数据输出30

2.4.7 处理历史31

2.5 小结31

第3章 数据可视化32

3.1 数据导向文件32

3.1.1 HTML33

3.1.2 DOM33

3.1.3 CSS34

3.1.4 JavaScript34

3.1.5 SVG34

3.2 开始使用D3.js34

3.2.1 柱状图35

3.2.2 饼图39

3.2.3 散点图41

3.2.4 单线图43

3.2.5 多线图46

3.3 交互与动画49

3.4 小结52

第4章 文本分类53

4.1 学习和分类53

4.2 贝叶斯分类54

4.3 E-mail主题测试器55

4.4 数据56

4.5 算法57

4.6 分类器的准确性61

4.7 小结62

第5章 基于相似性的图像检索63

5.1 图像相似性搜索63

5.2 动态时间规整64

5.3 处理图像数据集65

5.4 执行DTW66

5.5 结果分析68

5.6 小结70

第6章 模拟股票价格71

6.1 金融时间序列71

6.2 随机游走模拟72

6.3 蒙特·卡罗方法73

6.4 生成随机数73

6.5 用D3.js实现74

6.6 小结80

第7章 预测黄金价格82

7.1 处理时间序列数据82

7.2 平滑时间序列85

7.3 数据——历史黄金价格87

7.4 非线性回归88

7.4.1 核岭回归88

7.4.2 平滑黄金价格时间序列90

7.4.3 平滑时间序列的预测91

7.4.4 对比预测值92

7.5 小结93

第8章 使用支持向量机的方法进行分析94

8.1 理解多变量数据集94

8.2 降维97

8.2.1 线性无差别分析98

8.2.2 主成分分析98

8.3 使用支持向量机100

8.3.1 核函数101

8.3.2 双螺旋问题101

8.3.3 在mlpy中执行SVM102

8.4 小结105

第9章 应用细胞自动机的方法对传染病进行建模106

9.1 流行病学简介106

9.2 流行病模型108

9.2.1 SIR模型108

9.2.2 使用SciPy来解决SIR模型的常微分方程108

9.2.3 SIRS模型110

9.3 对细胞自动机进行建模111

9.3.1 细胞、状态、网格和邻域111

9.3.2 整体随机访问模型111

9.4 通过D3js模拟CA中的SIRS模型112

9.5 小结120

第10章 应用社会化图谱121

10.1 图谱的结构121

10.1.1 间接图谱121

10.1.2 直接图谱122

10.2 社会化网络分析122

10.3 捕获Facebook图谱123

10.4 使用Gephi对图谱进行再现126

10.5 统计分析128

10.6 度的分布129

10.6.1 图谱直方图130

10.6.2 集中度131

10.7 将GDF转化为JSON133

10.8 在D3.js环境下进行图谱可视化135

10.9 小结139

第11章 对Twitter数据进行情感分析140

11.1 解析Twitter数据140

11.1.1 tweet140

11.1.2 粉丝141

11.1.3 热门话题141

11.2 使用OAuth访问API142

11.3 开始使用Twython143

11.3.1 简单查询144

11.3.2 处理时间表147

11.3.3 处理粉丝149

11.3.4 处理地点和趋势信息151

11.4 情感分类153

11.4.1 ANEW154

11.4.2 语料库154

11.5 使用NLTK155

11.5.1 单词包156

11.5.2 朴素贝叶斯156

11.5.3 tweet的情感分析158

11.6 小结159

第12章 使用MongoDB进行数据处理和聚合160

12.1 开始使用MongoDB160

12.1.1 数据库161

12.1.2 集合161

12.1.3 文件162

12.1.4 Mongo shell162

12.1.5 Insert/Update/Delete163

12.1.6 Queries查询163

12.2 数据准备165

12.2.1 使用OpenRefine进行数据转换165

12.2.2 通过PyMongo来插入文件167

12.3 分组169

12.4 聚合框架172

12.4.1 流水线173

12.4.2 表达式174

12.5 小结175

第13章 使用MapReduce方法176

13.1 MapReduce概述176

13.2 编程模型177

13.3 在MongoDB中使用MapReduce178

13.3.1 map函数178

13.3.2 reduce函数178

13.3.3 使用Mongo shell179

13.3.4 使用UMongo180

13.3.5 使用PyMongo182

13.4 过滤输入集合184

13.5 分组和聚合184

13.6 文字云对tweet中最常见的积极词汇进行可视化186

13.7 小结191

第14章 使用IPython和Wakari进行在线数据分析192

14.1 开始使用Wakari192

14.2 开始使用IPython记事本195

14.3 通过PIL进行图像处理简介197

14.3.1 打开一个图像197

14.3.2 图像直方图198

14.3.3 过滤198

14.3.4 操作200

14.3.5 转化201

14.4 使用Pandas202

14.4.1 处理时间序列202

14.4.2 通过数据框架来操作多变量数据集206

14.4.3 分组、聚合和相关208

14.5 使用IPython进行多机处理211

14.6 分享你的记事本212

14.7 小结214

附录 环境搭建215

热门推荐