图书介绍

文挖掘 基于R语言的整洁工具2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

文挖掘 基于R语言的整洁工具
  • 茱莉亚.斯拉格 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111588559
  • 出版时间:2018
  • 标注页数:162页
  • 文件大小:17MB
  • 文件页数:169页
  • 主题词:程序语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

文挖掘 基于R语言的整洁工具PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

前言1

第1章 整洁文本格式7

比较整洁文本结构与其他数据结构8

unnest tokens函数8

整理Jane Austen的作品10

gutenbergr包13

词频13

总结17

第2章 基于整洁数据的情感分析18

情感数据集18

内连接的情感分析21

比较三个情感词典24

最常见的正面单词和负面单词26

Wordclouds模块28

除单词外的其他文本单元30

总结32

第3章 分析词和文件频率:tf-idf33

Jane Austen小说中的词项频率34

Zipf定律35

bind tf idf函数38

物理学语料库41

总结45

第4章 词之间的关系:n-gram及相关性46

n-gram词条化46

用widyr包对单词对计数并计算相关性60

总结66

第5章 非整洁格式转换67

使文档-词项矩阵整洁67

将整洁文本数据转换为矩阵74

总结84

第6章 主题建模85

LDA86

示例:博大的图书馆馆藏91

LDA方法的替代实现101

总结102

第7章 案例研究:Twitter归档文件比较103

单词使用情况的比较107

单词使用情况的变化109

收藏和转发113

总结117

第8章 案例研究:NASA元数据挖掘118

NASA如何组织数据118

共现单词与相关单词123

计算描述字段的tf-idf129

总结142

第9章 案例研究:分析Usenet文本143

预处理143

新闻组中的单词146

情感分析151

总结159

参考文献160

热门推荐