英文分词


被导师要求写一篇英文分析方面的文章,选了一个英文分析的工具 nltk ,首先在命令行中运行 pip install nltk 安装,然后 运行nltk.download() 下载语料库,但是发现链接失败报错:由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。

nltk.download()由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。

解决办法,从github官网手动下载解压。

地址:nltk/nltk_data: NLTK Data (github.com)

然后将下载的文件解压,解压后会有一个packages文件夹,将packages文件夹里面的东西,全部文件复制下来,然后黏贴在nltk_data文件夹里,nltk_data没有的话创建一个,至于nltk_data文件夹的路径在

运行程序

import nltk
from nltk.stem import SnowballStemmer
stemmer= SnowballStemmer("english") #选择语言,如:英语
stemmer.stem("countries") #设置一个词汇
from nltk.stem import WordNetLemmatizer
wnl=WordNetLemmatizer()
print(wnl.lemmatize('countries'))#输出还原的词汇,会输出country

pycharm会输出提示如下:

Searched in:
- ‘C:\Users\胡余生/nltk_data’
- ‘D:\anaconda\nltk_data’
- ‘D:\anaconda\share\nltk_data’
- ‘D:\anaconda\lib\nltk_data’
- ‘C:\Users\胡余生\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’

选一个路径创建文件夹nltk_data,然后将解压后的文件夹里的packages放入nltk_data,然后就成功了。

分析方法参考如下链接:

https://blog.csdn.net/weixin_39717825/article/details/110177611

安装Gephi,Gephi运行需要java环境,安装好Gephi后修改安装Gephi目录下的etc文件夹中的gephi.conf,用记事本打开,将javahome前面的#号去掉并且修改javahome路径,javahome路径为所安装的jdk路径

Gephi:https://gephi.org/
JDK:https://www.oracle.com/java/technologies/javase-downloads.html

如果要调用nltk里的工具包,别忘记吧packages里的文件加相应的文件里的压缩包解压,比如运用nltk_data\chunkers里的工具要将maxent_ne_chunker.zip压缩包解压。

Gephi工具里的预览有时候会显示不出来,我的将项目保存,重启软件加载项目刷新就出来了。

网上还有用这种方法解决的(对我无效):

删除user directory https://github.com/gephi/gephi/wiki/Troubleshooting

更新Java的jdk版本

Gephi使用以及导入数据时边表格选不了的解决方法

应用gephi进行分析,首先点击导出表格

1

然后向输出表格里写入数据

2

格式为csv格式,然后将写入的数据导入gephi

3

选择输入电子表格

4

选择边表格(注意:如果不用其输出表格的文件写入数据,将会选不了边表格选项)

5

导入的时候选择加入当前项目,无向图

然后就添加成功了,然后更改点和边的外观,点和边是一样的这里只介绍点的更改

更改点的度数与大小相关,更改完点击应用!!!

更改点的大小与度数相关

更改字体颜色

更改点的字体颜色

更改点的颜色随度数变化

点的颜色随度数变化

选择布局

布局

点的外观更改的时候别忘记点击应用!!!选完布局点击运行。

运行后结果

概览结果

然后点击预览,在下面窗口设置。

预览点设置

给label添加数据

给label添加数据

设置边的厚度

边的厚度

最终结果图

最终结果图

共现网络绘制完成,完结撒花!!!

图


文章作者: HuXiao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 HuXiao !
评论
  目录