图书介绍
文挖掘 基于R语言的整洁工具2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 茱莉亚.斯拉格 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111588559
- 出版时间:2018
- 标注页数:162页
- 文件大小:17MB
- 文件页数:169页
- 主题词:程序语言-程序设计
PDF下载
点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]
下载说明
文挖掘 基于R语言的整洁工具PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
前言1
第1章 整洁文本格式7
比较整洁文本结构与其他数据结构8
unnest tokens函数8
整理Jane Austen的作品10
gutenbergr包13
词频13
总结17
第2章 基于整洁数据的情感分析18
情感数据集18
内连接的情感分析21
比较三个情感词典24
最常见的正面单词和负面单词26
Wordclouds模块28
除单词外的其他文本单元30
总结32
第3章 分析词和文件频率:tf-idf33
Jane Austen小说中的词项频率34
Zipf定律35
bind tf idf函数38
物理学语料库41
总结45
第4章 词之间的关系:n-gram及相关性46
n-gram词条化46
用widyr包对单词对计数并计算相关性60
总结66
第5章 非整洁格式转换67
使文档-词项矩阵整洁67
将整洁文本数据转换为矩阵74
总结84
第6章 主题建模85
LDA86
示例:博大的图书馆馆藏91
LDA方法的替代实现101
总结102
第7章 案例研究:Twitter归档文件比较103
单词使用情况的比较107
单词使用情况的变化109
收藏和转发113
总结117
第8章 案例研究:NASA元数据挖掘118
NASA如何组织数据118
共现单词与相关单词123
计算描述字段的tf-idf129
总结142
第9章 案例研究:分析Usenet文本143
预处理143
新闻组中的单词146
情感分析151
总结159
参考文献160
热门推荐
- 2112321.html
- 439271.html
- 3480255.html
- 3866420.html
- 2438020.html
- 3652960.html
- 2279973.html
- 3705108.html
- 2017110.html
- 954364.html
- http://www.ickdjs.cc/book_2292451.html
- http://www.ickdjs.cc/book_194778.html
- http://www.ickdjs.cc/book_2581316.html
- http://www.ickdjs.cc/book_179854.html
- http://www.ickdjs.cc/book_1889971.html
- http://www.ickdjs.cc/book_211620.html
- http://www.ickdjs.cc/book_195391.html
- http://www.ickdjs.cc/book_3434977.html
- http://www.ickdjs.cc/book_3169565.html
- http://www.ickdjs.cc/book_2232295.html