图书介绍

Collective Intelligence实战2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

（美）SatnamAlag著；腾灵灵，冯飞译著
出版社：北京：清华大学出版社
ISBN：9787302233022
出版时间：2010
标注页数：385页
文件大小：60MB
文件页数：399页
主题词：网页－制作－软件工具

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：b85e3d8a7604188a0723c757e749bb81

下载说明

Collective Intelligence实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第Ⅰ部分收集数据，获取智慧3

第1章了解集体智慧（CI）3

1.1 什么是集体智慧4

1.2 集体智慧在Web应用程序中的应用5

1.2.1 通过一个示例全面了解集体智慧6

1.2.2 使用集体智慧的好处8

1.2.3 集体智慧是Web 2.0的核心9

1.2.4 利用CI将以内容为中心的应用程序转化为以用户为中心的应用程序10

1.3 对智慧进行分类12

1.3.1 显性智慧12

1.3.2 隐性智慧14

1.3.3 衍生智慧14

1.4 小结16

1.5 相关资源16

第2章从用户交互中学习19

2.1 运用智慧的体系结构19

2.1.1 同步和异步服务20

2.1.2 事件驱动系统中的实时学习21

2.1.3 非事件驱动系统中的轮询22

2.1.4 事件驱动和非事件驱动体系结构的优缺点23

2.2 应用集体智慧的算法23

2.2.1 用户和项目23

2.2.2 表示用户信息25

2.2.3 基于内容的分析和协作过滤26

2.2.4 从非结构化文本中提取智慧27

2.2.5 计算相似度29

2.2.6 数据集的类型29

2.3 用户交互的形式32

2.3.1 评分和投票32

2.3.2 邮寄或转发链接33

2.3.3 书签和保存34

2.3.4 购物记录35

2.3.5 点击流35

2.3.6 评论36

2.4 将用户交互转化为集体智慧38

2.4.1 一个将评分转化为智慧的示例38

2.4.2 来自书签、保存项目、购物记录、链接转发、点击流和评论的智慧44

2.5 小结46

2.6 相关资源46

第3章从标签中提取智慧49

3.1 标记50

3.1.1 用户和项目的标签元数据50

3.1.2 专业生成的标签51

3.1.3 用户生成的标签51

3.1.4 计算机生成的标签52

3.1.5 有关标记的建议52

3.1.6 用户进行标记的原因53

3.2 如何利用标签54

3.2.1 构建动态导航54

3.2.2 创新使用标签云56

3.2.3 目标搜索56

3.2.4 公众分类与构建一个字典57

3.3 从用户标签中提取智慧的一个示例57

3.3.1 与其他项目相关的项目58

3.3.2 用户感兴趣的项目59

3.3.3 某个项目的相关用户60

3.4 用于标记的可扩展持久化体系结构60

3.4.1 回顾其他方法60

3.4.2 推荐的持久化体系结构63

3.5 构建标签云67

3.5.1 标签云的持久化设计67

3.5.2 构建一个标签云的算法68

3.5.3 实现标签云69

3.5.4 显示标签云74

3.6 找到类似标签78

3.7 小结78

3.8 相关资源79

第4章从内容中提取智慧81

4.1 内容类型与整合81

4.1.1 对内容进行分类81

4.1.2 整合内容的体系结构83

4.2 与集体智慧有关的主要内容类型84

4.2.1 博客85

4.2.2 维基87

4.2.3 组和留言板89

4.3 逐步提取智慧91

4.3.1 构建示例92

4.3.2 朴素分析94

4.3.3 删除常见词97

4.3.4 提取词干98

4.3.5 检测短语99

4.4 简单和复合内容类型101

4.5 小结102

4.6 相关资源103

第5章搜索博客圈107

5.1 博客圈简介108

5.1.1 利用博客圈108

5.1.2 RSS：发布格式109

5.1.3 博客跟踪公司110

5.2 构建一个架构以搜索博客圈111

5.2.1 搜索器112

5.2.2 搜索参数113

5.2.3 查询结果114

5.2.4 处理XML响应115

5.2.5 异常处理116

5.3 实现基类116

5.3.1 实现搜索参数116

5.3.2 实现结果对象117

5.3.3 实现搜索器118

5.3.4 解析XML响应123

5.3.5 扩展该架构126

5.4 整合Technorati127

5.4.1 Technorati搜索API概述128

5.4.2 实现整合Technorati所需的类129

5.5 整合Bloglines134

5.5.1 Bloglines搜索API概述135

5.5.2 实现整合Bloglines所需的类136

5.6 使用RSS整合提供商139

5.6.1 泛化查询参数139

5.6.2 泛化博客搜索器141

5.6.3 构建RSS 2.0 XML解析器142

5.7 小结144

5.8 相关资源144

第6章智能Web爬行147

6.1 Web爬行简介148

6.1.1 为什么要在Web上爬行148

6.1.2 爬行过程149

6.1.3 智能爬行和聚焦爬行150

6.1.4 深度爬行151

6.1.5 可用的爬虫152

6.2 逐步构建一个智能爬虫153

6.2.1 实现核心算法153

6.2.2 遵循robots.txt文件158

6.2.3 检索内容160

6.2.4 提取URL161

6.2.5 使爬虫具有智能163

6.2.6 运行爬虫163

6.2.7 扩展爬虫165

6.3 使用Nutch进行可扩展的爬行166

6.3.1 搭建Nutch166

6.3.2 运行Nutch爬虫167

6.3.3 使用Nutch进行搜索170

6.3.4 Apache Hadoop、MapReduce和Dryad171

6.4 小结173

6.5 相关资源173

第Ⅱ部分衍生智慧177

第7章数据挖掘：过程、工具包和标准177

7.1 数据挖掘中的核心概念177

7.1.1 属性178

7.1.2 监督性和非监督性学习179

7.1.3 关键的学习算法180

7.1.4 挖掘过程182

7.2 使用开源数据挖掘架构：WEKA183

7.2.1 使用WEKA应用程序184

7.2.2 理解WEKA的API187

7.2.3 WEKA的API使用示例189

7.3 标准数据挖掘API:Java Data Mining(JDM)194

7.3.1 JDM体系结构195

7.3.2 关键的JDM对象196

7.3.3 表示数据集197

7.3.4 学习模型198

7.3.5 算法设置199

7.3.6 JDM任务200

7.3.7 JDM连接201

7.3.8 访问DME的示例代码202

7.3.9 JDM模型和PMML204

7.4 小结204

7.5 相关资源205

第8章构建文本分析工具包207

8.1 构建文本分析器208

8.1.1 利用Lucene209

8.1.2 编写一个词干分析器213

8.1.3 编写一个TokenFilter来注入同义词和检测短语215

8.1.4 编写一个分析器来注入同义词和检测短语218

8.1.5 让分析器工作起来219

8.2 构建文本分析基础结构222

8.2.1 构建标签基础结构223

8.2.2 构建单词向量基础结构225

8.2.3 构建TextAnalyzer类231

8.2.4 应用文本分析基础结构235

8.3 架构的使用案例238

8.4 小结239

8.5 相关资源239

第9章通过聚类发现模式241

9.1 聚类博客文章241

9.1.1 定义文本聚类基础结构242

9.1.2 从Technorati中检索博客文章244

9.1.3 为文本处理实现k-均值聚类算法248

9.1.4 为文本处理实现层次聚类算法254

9.1.5 期望最大化以及其他聚类高维稀疏数据的示例262

9.2 使用WEKA的聚类263

9.2.1 创建学习数据集263

9.2.2 创建聚类器266

9.2.3 评估聚类过程的结果267

9.3 使用JDM API的聚类269

9.3.1 与聚类相关的重要的JDM类269

9.3.2 使用JDM API的聚类设置270

9.3.3 使用JDM API创建聚类任务272

9.3.4 使用JDM API执行聚类任务272

9.3.5 使用JDM API检索聚类模型273

9.4 小结273

9.5 相关资源274

第10章进行预测275

10.1 分类的基础知识276

10.1.1 通过示例学习决策树276

10.1.2 朴素贝叶斯分类器282

10.1.3 信度网286

10.2 使用WEKA API来给博客文章分类287

10.2.1 为博客文章的分类构建数据集288

10.2.2 构建分类器的类292

10.3 回归的基础知识295

10.3.1 线性回归295

10.3.2 多层感知器（MLP）297

10.3.3 径向基函数（RBF）298

10.4 使用WEKA的回归299

10.5 使用JDM的分类和回归300

10.5.1 与监督性学习相关的、重要的JDM类300

10.5.2 使用了JDM API的监督性学习设置302

10.5.3 使用JDM API创建分类任务304

10.5.4 使用JDM API执行分类任务304

10.5.5 使用JDM API检索分类模型305

10.5.6 使用JDM API检索分类模型305

10.6 小结306

10.7 相关资源306

第Ⅲ部分在应用程序中运用集体智慧第11章智能搜索311

11.1 搜索的基础知识311

11.1.1 搜索的体系结构312

11.1.2 核心的Lucene类313

11.1.3 通过示例介绍索引和搜索的基本过程314

11.2 通过Lucene建立索引321

11.2.1 理解索引的格式321

11.2.2 修改索引322

11.2.3 增量索引323

11.2.4 访问词频向量325

11.2.5 优化建立索引过程的性能326

11.3 使用Lucene进行搜索328

11.3.1 理解Lucene的评分机制328

11.3.2 查询Lucene330

11.3.3 给搜索结果排序332

11.3.4 在多个字段上查询333

11.3.5 过滤334

11.3.6 搜索多个索引335

11.3.7 使用HitCollector336

11.3.8 优化搜索性能339

11.4 有用的工具和架构339

11.4.1 Luke339

11.4.2 Solr340

11.4.3 Compass341

11.4.4 Hibernate搜索341

11.5 实现智能搜索的方法341

11.5.1 通过分类器和预测器增强搜索342

11.5.2 聚类搜索的结果342

11.5.3 为用户个性化结果344

11.5.4 基于群体的搜索344

11.5.5 基于语言学的搜索345

11.5.6 数据搜索345

11.6 小结346

11.7 相关资源347

第12章构建推荐引擎349

12.1 推荐引擎的基础知识350

12.1.1 推荐引擎简介350

12.1.2 基于项目和基于用户的分析351

12.1.3 使用基于内容的技术和协作技术来计算相似度352

12.1.4 基于内容的技术与协作技术的比较353

12.2 基于内容的分析354

12.2.1 使用搜索引擎（Lucene）寻找类似的项目355

12.2.2 构建基于内容的搜索引擎358

12.2.3 文档聚类的相关项目361

12.2.4 为用户个性化内容362

12.3 协作过滤362

12.3.1 k最近邻算法363

12.3.2 实现协作过滤的包364

12.3.3 通过潜在语义索引减少维度368

12.3.4 实现维度减少369

12.3.5 基于概率模型的方法372

12.4 现实世界中的解决方案372

12.4.1 Amazon的项目-项目推荐372

12.4.2 Google News的个性化修改375

12.4.3 Netflix以及Netflix奖金的BellKor解决方案378

12.5 小结382

12.6 相关资源383