图书介绍

R数据科学实战 工具详解与案例分析2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

R数据科学实战 工具详解与案例分析
  • (中国)邬书豪,刘健 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111629948
  • 出版时间:2019
  • 标注页数:242页
  • 文件大小:25MB
  • 文件页数:254页
  • 主题词:程序语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

R数据科学实战 工具详解与案例分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 工具包篇2

第1章 数据导入工具2

1.1 utils——数据读取基本功3

1.1.1 read.csv/csv2——逗号分隔数据读取3

1.1.2 read.delim/delim2——特定分隔符数据读取6

1.1.3 read.table——任意分隔符数据读取7

1.2 readr——进阶数据读取15

1.3 utils vs readr——你喜欢哪个?17

1.4 readxl——Excel文件读取18

1.5 DBI——数据库数据查询、下载21

1.6 pdftools——PDF文件22

1.7 jsonlite——JSON文件25

1.8 foreign package统计软件数据26

1.9 本章小结27

第2章 数据清理工具28

2.1 基本概念29

2.2 tibble包——数据集准备31

2.2.1 为什么使用tibble32

2.2.2 创建tbl格式34

2.2.3 as tibble——转换已有格式的数据集34

2.2.4 add row/column——实用小工具37

2.3 tidyr——数据清道夫40

2.3.1 为什么使用tidyr40

2.3.2 gather/spread——“长”“宽”数据转换40

2.3.3 separate/unite——拆分合并列43

2.3.4 replace_ na/drop_ na/——默认值处理工具44

2.3.5 fill/complete——填坑神器44

2.3.6 separate_rows/nest/unest——行数据处理45

2.4 lubridate日期时间处理47

2.4.1 为什么使用lubridate47

2.4.2 ymd/ymd_ hms——年月日还是日月年?48

2.4.3 year/month/week/day/hour/minute/second——时间单位提取49

2.4.4 guess_formats/parse_date time——时间日期格式分析49

2.5 stringr字符处理工具51

2.5.1 baseR vs stringr51

2.5.2 正则表达式基础53

2.5.3 简易正则表达式创建54

2.5.4 文本挖掘浅析55

第3章 数据计算工具58

3.1 baseR计算工具概览59

3.1.1 基本数学函数59

3.1.2 基本运算符号61

3.1.3 基本统计函数62

3.2 dplyr包实战技巧63

3.2.1 常见实用函数中英对照63

3.2.2 dplyr行(Row)数据处理64

3.2.3 dplyr列(Column)数据处理73

3.3 文本挖掘实操88

第4章 基本循环——loops和apply92

4.1 for循环93

4.1.1 基本概念93

4.1.2 基本构建过程94

4.1.3 简单应用97

4.2 while循环98

4.2.1 基本概念98

4.2.2 基本构建过程99

4.2.3 简单应用100

4.3 “apply”函数家族102

4.3.1 lapply——“线性”数据迭代103

4.3.2 sapply——简约而不简单106

4.3.3 apply——多维数据处理利器107

4.3.4 vapply——迭代的安全模式109

4.3.5 rapply——多层列表数据处理112

4.3.6 mapply——对多个列表进行函数运算115

第5章 优雅的循环——purrr包119

5.1 map函数家族120

5.1.1 map——对单一元素进行迭代运算120

5.1.2 map2和pmap——对两个及以上元素进行迭代运算125

5.1.3 imap——变量名称或位置迭代128

5.1.4 lmap——对列表型数据中的列表元素进行迭代运算130

5.1.5 invoke_map——对多个元素进行多个函数的迭代运算131

5.2 探测函数群134

5.2.1 detect/detect index——寻找第一个匹配条件的值134

5.2.2 every/some——列表中是否全部或部分元素满足条件?136

5.2.3 has_element——向量中是否存在想要的元素?137

5.2.4 head/tail while——满足条件之前和之后的元素138

5.2.5 keep/discard/com-pact——有条件筛选139

5.2.6 prepend——随意插入数据141

5.3 向量操纵工具箱142

5.3.1 accumulate和reduce家族——元素累积运算142

5.3.2 其他工具函数143

5.4 其他实用函数144

5.4.1 set_names——命名向量中的元素144

5.4.2 vec_depth——嵌套列表型数据探测器148

5.5 循环读取、清理和计算149

第6章 data.table——超级“瑞士军刀”152

6.1 data.table简介152

6.2 基本函数153

6.2.1 fread——速读153

6.2.2 DT[i,j,by]——数据处理句式基本结构158

6.2.3 “:=”——急速修改数值162

6.2.4 fwrite——速写,数据输出165

6.3 进阶应用167

6.3.1 有条件的急速行筛选168

6.3.2 列选择的多种可能171

6.3.3 批量处理列及列的分裂与合并173

6.3.4 合并数据集176

6.3.5 “长宽”数据置换177

6.3.6 计算分析178

第二部分 案例篇182

第7章 数据科学从业者调查分析182

7.1 案例背景及变量介绍182

7.2 简单数据清洗183

7.3 数据科学从业者探索性数据分析186

7.4 封装绘图函数189

7.5 通过柱状图进行探索性分析数据190

7.6 未来将会学习的机器学习工具193

7.7 明年将学习的机器学习方法194

第8章 共享单车租用频次分析198

8.1 案例简介198

8.2 数据准备及描述性统计分析199

8.3 数据重塑201

8.4 柱状图在数据分析中的简单应用202

8.5 柱状和扇形图在数据分析中的运用204

8.6 折线图在数据分析中的运用207

8.7 相关系数图综合分析209

第9章 星巴克商业案例分析211

9.1 案例背景介绍及变量介绍211

9.2 数据描述性统计量分析212

9.3 数据统计分析213

第10章 学生成绩水平分析220

10.1 数据集220

10.2 探索性数据分析229

第11章 YouTube视频观看分析234

11.1 案例背景及相关内容介绍234

11.2 探索性数据分析237

热门推荐