图书介绍

数据科学中的R语言2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据科学中的R语言
  • 李舰,肖凯著;吴喜之审校 著
  • 出版社: 西安:西安交通大学出版社
  • ISBN:9787560570822
  • 出版时间:2015
  • 标注页数:402页
  • 文件大小:146MB
  • 文件页数:417页
  • 主题词:程序语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据科学中的R语言PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言:数据科学与R1

1.1 数据科学简介1

1.1.1 什么是数据科学?1

1.1.2 如何成为数据科学家?9

1.2 R语言简介14

1.2.1 什么是R?14

1.2.2 如何学习R语言?17

1.2.3 R的安装和配置18

1.2.4 R的常用编辑器21

1.2.5 R的第一步23

1.3 如何使用本书?26

1.3.1 排版和代码环境26

1.3.2 测试环境27

1.3.3 本书相关资源27

第一部分 编程篇29

第2章 数据对象30

2.1 基本对象30

2.1.1 向量入门30

2.1.2 向量的生成32

2.1.3 向量的计算34

2.2 复合对象36

2.2.1 矩阵36

2.2.2 数据框39

2.2.3 列表43

2.3 特殊对象44

2.3.1 缺失值与空值44

2.3.2 连接45

2.3.3 公式46

2.3.4 表达式46

2.3.5 环境48

2.3.6 函数49

第3章 数据操作51

3.1 向量化操作51

3.2 数据转换整理57

3.2.1 取子集和编码转换57

3.2.2 长宽格式互转58

3.2.3 数据的拆分和合并62

3.3 输入与输出64

3.3.1 控制台的输入和输出64

3.3.2 文本文件65

3.3.3 表格型文件66

3.3.4 其他外部文件67

3.4 时间相关数据的处理67

3.4.1 时间类数据处理68

3.4.2 时间序列类数据69

3.4.3 时间数据处理实例71

第4章 控制语句与函数75

4.1 控制语句75

4.1.1 条件判断75

4.1.2 循环78

4.2 函数81

4.3 函数式编程88

4.4 工程开发的相关函数93

4.4.1 程序调试93

4.4.2 异常处理94

第5章 面向对象99

5.1 对象导论99

5.1.1 面向对象的思想99

5.1.2 面向对象编程的特性100

5.1.3 R的内置对象102

5.2 S3103

5.2.1 初识S3103

5.2.2 面向对象的实现105

5.3 S4108

5.3.1 类的定义108

5.3.2 对象的实例化110

5.3.3 泛型函数和多态113

5.4 引用对象116

第二部分 模型篇119

第6章 统计模型与回归分析121

6.1 线性回归121

6.1.1 回归模型和经典假设121

6.1.2 参数估计122

6.1.3 模型预测125

6.1.4 离散自变量的情况126

6.2 模型的诊断127

6.2.1 非正态性127

6.2.2 非线性127

6.2.3 异方差130

6.2.4 自相关131

6.2.5 异常值132

6.2.6 多重共线性134

6.3 线性回归的扩展135

6.3.1 非线性回归135

6.3.2 非参数回归138

6.3.3 Logistic回归143

第7章 其他统计分析方法148

7.1 假设检验148

7.2 多元分析154

7.2.1 主成分分析155

7.2.2 对应分析159

7.2.3 多元分析的可视化160

7.3 时间序列161

7.4 随机模拟169

7.4.1 随机变量与分布169

7.4.2 蒙特卡洛方法172

第8章 数据挖掘和机器学习176

8.1 一般挖掘流程176

8.2 聚类180

8.2.1 层次聚类181

8.2.2 K均值聚类184

8.2.3 基于密度的聚类186

8.2.4 自组织映射188

8.3 分类190

8.3.1 决策树模型190

8.3.2 贝叶斯分类196

8.3.3 最近邻分类198

8.3.4 神经网络分类199

8.3.5 支持向量机分类200

8.3.6 集成学习与随机森林203

第9章 最优化方法207

9.1 无约束非线性规划207

9.2 线性规划213

9.2.1 整数规划216

9.2.2 Rglpk简介217

9.3 约束非线性规划219

9.4 遗传算法225

第10章 数据可视化231

10.1 R语言可视化简介231

10.1.1 什么是数据可视化231

10.1.2 R语言的可视化环境234

10.1.3 ggplot2入门234

10.2 分布的特征239

10.3 比例的构成242

10.4 时间的变化246

10.5 R与交互可视化248

第三部分 应用篇251

第11章 R在热门行业中的应用252

11.1 R与金融分析252

11.1.1 金融数据获取和操作253

11.1.2 资产特征描述255

11.1.3 最优资产组合261

11.1.4 期权定价计算264

11.2 R与新药研发266

11.2.1 新药研发简介267

11.2.2 药动学和药效学270

11.2.3 建模和模拟275

第12章 R与互联网文本挖掘280

12.1 网络数据获取280

12.1.1 XML与XPath280

12.1.2 RCurl抓取网页284

12.1.3 Rweibo与OAuth284

12.2 中文文本处理285

12.2.1 文本处理285

12.2.2 正则表达式289

12.2.3 中文分词292

12.3 文本挖掘296

12.3.1 文本对象297

12.3.2 基本操作299

12.3.3 分析方法300

第13章 大数据时代下的R304

13.1 地理信息数据304

13.1.1 空间数据对象304

13.1.2 R与GIS的结合307

13.1.3 互联网地理信息311

13.2 社交网络数据312

13.2.1 R与网络数据312

13.2.2 R与Gephi的结合318

13.3 图像数据318

13.3.1 图像数据的处理319

13.3.2 图像识别323

第14章 可重复的数据分析328

14.1 基于Sweave的报告328

14.1.1 LATEX与Sweave328

14.1.2 R的Vignettes333

14.2 基于knitr的报告333

14.2.1 Markdown简介333

14.2.2 knitr和LATEX337

14.2.3 报告中的图片337

14.2.4 xtable与表格生成338

14.2.5 slidify与幻灯片339

14.3 基于Office的报告340

14.3.1 R2PPT341

14.3.2 ReporteRs344

第15章 R与其他系统的交互347

15.1 R与Excel347

15.1.1 安装DCOM环境347

15.1.2 安装RExcel348

15.1.3 RExcel的使用349

15.2 R与数据库353

15.2.1 DBI和RSQLite354

15.2.2 RODBC简介356

15.3 R与JAVA358

15.3.1 安装Java环境358

15.3.2 Java调用R359

15.3.3 R调用Java360

15.4 R与Microsoft Visual Studio361

15.4.1 R与VB361

15.4.2 R与C#363

第16章 R与高性能运算367

16.1 性能的度量与函数编译367

16.2 代数运算库的优化370

16.2.1 不同优化版本的实现371

16.2.2 性能对比372

16.3 超出内存的限制373

16.3.1 内存管理机制373

16.3.2 内存性能的优化374

16.3.3 内存外运算376

16.4 并行计算379

16.4.1 Rmpi与显式并行380

16.4.2 parallel包的应用384

16.4.3 RHadoop简介388

后记391

编后记392

参考文献393

索引397

热门推荐