1、下载一中文长篇小说,并转换成UTF-8编码。
2、使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。
3、排除一些无意义词、合并同一词。
4、对词频统计结果做简单的解读。
本文共 148 字,大约阅读时间需要 1 分钟。
1、下载一中文长篇小说,并转换成UTF-8编码。
2、使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。
3、排除一些无意义词、合并同一词。
4、对词频统计结果做简单的解读。
转载于:https://www.cnblogs.com/018linbin/p/7612316.html