Python解析英文电子书并提供词频统计和单词解释
程序用途
最近看英文原版电子书有点苦恼,很多单词联系上下文能懂个大概意思,不影响整体的阅读,但是看完之后又想巩固学习下陌生的单词。于是乎,就想的是能不能用python写个程序把单词根据单词等级(common,advanced)统计出现的频率并解释单词的意思,所以就有了这篇文章啦~
1.下载单词书
首先下载好英文书,这里分享一个免费下载电子书的网站https://zh.z-lib.gs/
以最近喜欢的Nicholas Sparks的《Message in a Bottle》举个🌰~
2.从epub文件中提取内容
1 |
|
3.按照级别分类单词并统计词频
1 |
|
可以看到上面的函数是先将文本进行单词的切割,再利用nltk库将单词分为Common和Advanced两类,并统计单词在文本中出现的频率。
4.获取单词的英文解释
1 |
|
这里利用nltk.corpus库中wordnet类来进行单词的解释
5.结果
程序运行出来的结果就是这样了,分为Common和Advanced两类,英文单词(出现的频次)以及单词的英文解释。
完整代码链接
https://github.com/YUTING0907/pythonTools/blob/main/TranslateAndCounter/extract_words_translate.py
觉得不错的话,支持一根棒棒糖吧 ୧(๑•̀⌄•́๑)૭
wechat pay
alipay
Python解析英文电子书并提供词频统计和单词解释
http://yuting0907.github.io/posts/416044d.html