图书介绍
大数据技术前沿2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 阮彤,王昊奋,陈为,张华平,高凯,唐杰等编 著
- 出版社: 北京:电子工业出版社
- ISBN:7121282712
- 出版时间:2016
- 标注页数:274页
- 文件大小:45MB
- 文件页数:286页
- 主题词:数据处理
PDF下载
下载说明
大数据技术前沿PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 大数据可视化概论1
1.1 可视化基础2
1.1.1 可视化释义2
1.1.2 可视化流程5
1.1.3 可视化编码6
1.1.4 可视化方法10
1.2 复杂数据可视化36
1.2.1 大数据可视化特点37
1.2.2 大尺度数据的可视化38
1.2.3 快速变化数据的可视化41
1.2.4 多变量数据的可视化44
1.2.5 非结构化数据的可视化50
1.2.6 大数据可视分析53
1.3 可视化与可视分析研发资源60
1.3.1 代表性开源与商业软件60
1.3.2 开发工具与编程语言61
1.3.3 可视化信息资源62
1.3.4 部分可视化科研机构63
参考文献64
第2章 文本大数据处理67
2.1 文本大数据概述67
2.2 中文词法分析70
2.3 句法分析73
2.4 语义分析74
2.5 开源项目与共享工具75
2.6 文本大数据的部分应用76
2.6.1 概述76
2.6.2 基于双数组Tie树的面向微博短文本的分词77
2.6.3 词义消歧80
2.6.4 未登录词识别83
2.6.5 文本分类与文本聚类84
2.6.6 机器翻译86
2.6.7 其他应用87
参考文献89
第3章 社交网络大数据挖掘91
3.1 概述91
3.2 大规模异构网络集成94
3.2.1 计算模型——COSNET96
3.2.2 模型求解98
3.2.3 实验结果99
3.3 基于交互的网络机器学习101
3.3.1 网络数据的主动交互学习101
3.3.2 算法模型——MaxCo102
3.3.3 网络流数据的主动交互学习103
3.3.4 算法模型104
3.4 基于随机路径的高效网络拓扑相似度算法106
3.4.1 问题定义107
3.4.2 基于随机路径的网络拓扑相似度算法——Panther107
3.4.3 实验结果110
3.4.4 小结113
3.5 个体行为与网络分布的统一建模框架——M3D113
3.5.1 研究方案114
3.5.2 实验验证115
3.6 总结和展望117
参考文献117
第4章 语义大数据——知识图谱119
4.1 大规模知识图谱技术119
4.1.1 知识图谱的表示及其在搜索中的展现形式119
4.1.2 知识图谱的构建121
4.1.3 知识图谱在搜索中的应用126
4.1.4 总结127
4.2 行业知识图谱工具127
4.2.1 简介127
4.2.2 常见的行业知识图谱129
4.2.3 行业知识图谱的构建131
4.2.4 行业知识图谱的应用139
4.2.5 应用案例141
第5章 图数据库——基于图的大数据管理147
5.1 图数据库简介147
5.1.1 大图数据148
5.1.2 OLTP与OLAP149
5.1.3 图数据模型151
5.1.4 图查询语言154
5.2 主流图数据库和图计算引擎160
5.2.1 最流行的图数据库——Neo4i160
5.2.2 分布式图数据库——Titan161
5.2.3 基于RDF三元组库的图数据库——Blazegraph162
5.2.4 基于Pregel框架的图计算引擎——Giraph、Hama、GraphLab、GraphX163
5.3 图数据库关键技术166
5.3.1 图数据库的存储166
5.3.2 图数据库的索引169
5.3.3 图数据库的查询处理172
5.4 图数据库应用175
5.4.1 语义万维网175
5.4.2 社会网络176
5.4.3 生物信息学177
参考文献178
第6章 内存计算——高速大数据处理的核心技术181
6.1 内存计算技术的一个误区181
6.2 TimesTen的设计思路182
6.3 Apache Spark的设计思路184
6.4 SAP HANA的设计思路186
6.5 YunTable 4.0的产品介绍188
6.5.1 整体架构与核心技术188
6.5.2 MPP190
6.5.3 列存2.0190
6.5.4 动态数据分发192
6.5.5 内存计算193
6.5.6 性能和路线图193
6.6 总结194
第7章 分布式存储系统——大数据存储支撑技术195
7.1 大数据对存储系统带来的挑战及其引发的变革195
7.2 谷歌文件系统(GFS)196
7.2.1 支持大数据集存取和离线批处理的分布式存储系统196
7.2.2 GFS架构分析197
7.2.3 系统交互204
7.2.4 主节点的设计208
7.2.5 容错和诊断213
7.2.6 小结216
7.3 支持海量数据和大规模并发访问的分布式对象存储OpenStack Swift216
7.3.1 互联网化带来新的存储需求216
7.3.2 OpenStack Swift的特点218
7.3.3 Swift的数据模型和架构221
7.3.4 Swift的API238
第8章 大数据安全技术245
8.1 差分隐私保护方法简介245
8.2 差分隐私研究保护方向——数据发布和数据挖掘248
8.2.1 基于差分隐私保护的数据发布(DPPDR)248
8.2.2 差分隐私保护数据挖掘(DPPDM)249
8.3 常见隐私保护方法249
8.3.1 差分隐私保护分类方法249
8.3.2 差分隐私保护聚类方法250
8.3.3 差分隐私频繁模式挖掘251
8.4 应用案例和原型系统251
参考文献253
第9章 众包——数据来源与质量保证255
9.1 众包255
9.1.1 众包的概念和模型255
9.1.2 众包的优劣分析257
9.2 众包的关键技术257
9.2.1 众包流程257
9.2.2 任务设计259
9.2.3 任务分配260
9.2.4 任务动态优化261
9.2.5 众包激励机制261
9.2.6 众包质量保障263
9.3 众包的成功案例和平台264
9.3.1 知识百科众包264
9.3.2 数据众包264
9.3.3 创新众包266
9.3.4 软件众包267
9.3.5 众筹268
9.3.6 通用智力劳动众包269
9.3.7 中国的众包平台269
9.4 众包研究趋势269
9.5 总结和展望271
参考文献272
热门推荐
- 2088269.html
- 1927646.html
- 1443972.html
- 245597.html
- 1137889.html
- 1742945.html
- 803079.html
- 2223959.html
- 168725.html
- 2698123.html
- http://www.ickdjs.cc/book_1413563.html
- http://www.ickdjs.cc/book_2895404.html
- http://www.ickdjs.cc/book_773192.html
- http://www.ickdjs.cc/book_574648.html
- http://www.ickdjs.cc/book_3380202.html
- http://www.ickdjs.cc/book_2151780.html
- http://www.ickdjs.cc/book_482674.html
- http://www.ickdjs.cc/book_2354783.html
- http://www.ickdjs.cc/book_2723610.html
- http://www.ickdjs.cc/book_1667240.html