【简介】
国际知名出版社 Springer出版了‘人文与社会科学定量研究方法”系列,其中一书,由重庆邮电大学外国语学院汪顺王教授主译,由外教社引进翻译版权出版。
本书理论与实践相结合,简明扼要地介绍了使用公开源代码的编程语言R对文本进行计算方法分析的基础知识。在分析层次的安排上,书中呈现了循序渐进的特点:从聚焦词汇层面的微观分析,到句子层面的中观分析,再到篇章内容层面的宏观分析。本书提出了‘聚类分析”‘分类分析”和‘主题建模分析”的概念和方法,为文学文本量化研究提供了新视角。
本书对从事文学文本研究、语料研究和大数据分析等研究的学生、教师以及对相关领域感兴趣的学界人士具有重要参考价值。
译者序
序言
中文版序
致谢
第一部分 微观分析
1 R基础
2 第一次尝试用R分析文本
3 获取和比较词频数据
4 形符分布分析
5 相关分析
第二部分 中观分析
6 测量词汇多样性
7 一次性词语的丰富度
8 语境关键词
9 动手做语境关键词表
10 文本质量、文本多样性和解析XML
第三部分宏观分析
11 聚类
12 分类
13 主题建模
附录
A 变量作用域例子
B 潜在狄利克雷分布(LDA)自助餐厅
C 启动代码
D 关于R资源的补充读物
E 验证R代码纠误表
练习答案
索引