图书介绍

数据天才 数据科学家修炼之道2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据天才 数据科学家修炼之道
  • (美)文森特·格兰维尔(Vincent Granville)著;吴博,张晓峰,季春霖译 著
  • 出版社: 北京:电子工业出版社
  • ISBN:7121308833
  • 出版时间:2017
  • 标注页数:331页
  • 文件大小:54MB
  • 文件页数:356页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据天才 数据科学家修炼之道PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据科学是什么1

真伪数据科学对比2

伪数据科学的两个例子5

新大学的面貌7

数据科学家10

数据科学家与数据工程师10

数据科学家与统计学家12

数据科学家与业务分析师13

13个真实世界情景中的数据科学应用14

情景1:国家对烈性酒销售的垄断结束后,DUI(酒后驾驶)逮捕量减少15

情景2:数据科学与直觉17

情景3:数据故障将数据变成乱码19

情景4:异常空间的回归21

情景5:分析与诱导在提升销量上有何不同价值22

情景6:关于隐藏数据24

情景7:汽油中的铅会导致高犯罪率。真的吗25

情景8:波音787(梦幻客机)问题26

情景9:NLP的7个棘手句子27

情景10:数据科学家决定着我们所吃的食品28

情景11:用较好的相关性增加亚马逊的销售量30

情景12:检测Facebook上的假档案或假“喜欢”数32

情景13:餐厅的分析33

数据科学的历史、开拓者和现代趋势33

统计学将会复兴34

历史与开拓者36

现代的趋势38

最近的问答讨论40

总结44

第2章 大数据的独特性45

两个大数据的问题45

大数据“诅咒”45

数据快速流动问题50

大数据技术示例56

大数据问题是数据科学所面临挑战的缩影56

大规模数据集的聚类和分类58

1亿行的Excel63

MapReduce不能做什么67

问题67

3种解决方案68

结论:何时使用MapReduce69

沟通问题70

数据科学:统计学的终结72

8种最差的预测建模技术72

把计算机科学、统计学和行业专业知识结合在一起74

大数据生态系统78

总结79

第3章 成为一名数据科学家80

数据科学家的主要特征80

数据科学家的职能80

横向与纵向数据科学家83

数据科学家的类型86

伪数据科学家86

自学成才的数据科学家86

业余数据科学家87

极限数据科学家89

数据科学家人群特征90

数据科学方面的培训91

大学课程91

公司和协会培训项目95

免费培训项目96

数据科学家职业道路98

独立顾问98

创业者105

总结118

第4章 数据科学的技术(Ⅰ)119

新型指标120

优化数字营销活动的指标121

欺诈检测的指标122

选择合适的分析工具124

分析软件124

可视化工具125

实时产品126

编程语言128

可视化128

用R生成数据视频129

更复杂的视频133

无模型的统计建模134

无模型的统计建模是什么135

该算法是如何工作的135

源代码生成数据集137

三类指标:中心性、波动性、颠簸性137

中心性、波动性和颠簸性之间的关系138

定义颠簸性138

在Excel中计算颠簸性139

使用颠簸系数141

大数据的统计聚类141

大数据的相关性和拟合度143

一系列新的秩相关性146

渐近分布与归一化148

计算复杂度152

计算q(n)152

理论上的解决方案155

结构系数156

确定簇的数量157

方法157

例子158

网络拓扑映射159

安全通信:数据加密163

总结166

第5章 数据科学的技术(Ⅱ)167

数据字典168

什么是数据字典168

建立数据字典169

隐性决策树169

实现方法171

示例:互联网流量打分173

结论175

与模型无关的置信区间175

方法175

分析桥第一定理176

应用177

源代码178

随机数179

解决问题的4个办法181

拥有超强直觉能力的业务分析师的直观法182

软件工程师的蒙特卡洛模拟法182

统计学家的统计建模方法183

计算机科学家的大数据方法183

因果关系和相关性183

怎样检测因果关系184

数据科学项目的生命周期186

预测模型的错误189

逻辑相关回归191

变量之间的相互作用191

一阶近似191

二阶近似193

用Excel进行回归分析195

实验设计196

有趣的指标196

把患者分成不同的人群进行治疗196

私人定制的治疗197

分析即服务和应用程序接口198

工作原理199

实施案例199

关键词相关的API的源代码200

其他主题204

当数据库改变时,保存好数值204

优化网络爬虫205

哈希连接206

用于模拟簇的简单源代码207

Hadoop和大数据的新型合成方差208

Hadoop和MapReduce的介绍208

综合指标209

Hadoop、数值的和统计的稳定性210

方差的抽象概念211

一个新的大数据定理213

平移不变性的度量标准214

实现:通信和计算成本214

最终意见215

总结215

第6章 数据科学应用案例研究217

股票市场217

使回报率提高500%的模式217

优化统计交易策略220

股票交易的API:统计模型222

股票交易的API:具体实现225

股票市场模拟226

些许数学知识229

新趋势231

加密232

数据科学应用:隐写术232

好的电子邮件加密236

验证码破解239

欺诈检测240

点击欺诈241

连续点击评分与二进制欺诈/非欺诈242

数学模型与基准244

虚假转化产生的偏差245

一些误解246

统计面临的挑战246

点击评分优化关键词出价247

组合优化自动快速的特征选择249

特征的预测能力:交叉验证250

勾连检测和僵尸网络的关联规则检测254

模式检测的极值理论255

数字分析256

在线广告:到达率和频率的计算公式256

电子邮件营销:提高300%的性能257

在7天内优化关键词广告宣传活动258

自动新闻提要优化260

用bit.ly进行竞争情报分析261

测量Twitter哈希标签(hashtag)的收益263

用3个修补方法提升谷歌搜索267

改进相关性的算法270

广告循环问题272

杂项273

简单模型会获得更好的销售预测273

更好的医疗欺诈检测275

归因模型276

预测陨石撞击277

在路口停车场收集数据281

数据科学的其他应用282

总结282

第7章 踏上你的数据科学职业之路283

面试问题283

关于工作经验的问题283

技术问题285

一般性问题286

关于数据科学项目的问题288

测试你自己的视觉和分析思维291

通过肉眼的检测模式292

识别偏差294

误导性的时间序列和随机游走295

从统计学家到数据科学家296

数据科学家也是统计从业人员297

谁应该给数据科学家教统计学298

雇佣问题298

数据科学家与数据架构师密切合作299

谁应该参与战略思考299

两种类型的统计学家300

大数据与取样301

数据科学家的分类302

数据科学最流行的技能集合302

LinkedIn上的顶级数据科学家306

400个数据科学家职位头衔309

薪酬调查311

根据技能和位置的薪酬分类312

创建自己的薪酬调查表316

总结317

第8章 数据科学资源318

专业资源318

数据集318

书籍319

会议与组织322

网站324

概念定义324

职业建设资源327

招聘数据科学家的公司328

数据科学招聘广告的样本329

简历样本329

总结331

热门推荐