机读格式显示(MARC)
- 010 __ |a 978-7-111-58855-9 |d CNY59.00
- 100 __ |a 20180508d2018 em y0chiy50 ea
- 200 1_ |a 文本挖掘 |A wen ben wa jue |e 基于R语言的整洁工具 |f Julia Silge, David Robinson著 |g 刘波, 罗棻, 唐亮贵译
- 210 __ |a 北京 |c 机械工业出版社 |d 2018.03
- 215 __ |a 161页 |c 图 |d 24cm
- 225 2_ |a O'Reilly精品图书系列 |A O'Reilly jing pin tu shu xi lie
- 306 __ |a 由O'Reilly Media, Inc.授权出版
- 314 __ |a 责任者Silge规范汉译姓: 斯拉格 ;责任者Robinson规范汉译姓: 罗宾逊
- 320 __ |a 有书目 (第160-161页)
- 330 __ |a 全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。
- 410 _0 |1 2001 |a O'Reilly精品图书系列
- 500 10 |a Text mining with R : a tidy approach |A Text Mining With R : A Tidy Approach |m Chinese
- 517 1_ |a 基于R语言的整洁工具 |A ji yu R yu yan de zheng jie gong ju
- 606 0_ |a 程序语言 |A cheng xu yu yan |x 程序设计
- 701 _1 |a 斯拉格 |A si la ge |g (Silge, Julia) |4 著
- 701 _1 |a 罗宾逊 |A luo bin xun |g (Robinson, David) |4 著
- 702 _0 |a 刘波 |A liu bo |4 译
- 702 _0 |a 罗棻 |A luo fen |4 译
- 702 _0 |a 唐亮贵 |A tang liang gui |4 译
- 801 _0 |a CN |b 安徽时代 |c 20191029
- 905 __ |a AUSTL |d TP312R/S478