Press "Enter" to skip to content

建议收藏 | nltk和spacy配置方法

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

 

 

nltk库和spacy库都是英文自然语言处理常用库,但是配置起来比较麻烦,今天就分享配置方法。

 

nltk配置

 

安装nltk库,命令行输入以下命令

 

pip3 install nltk

 

有些时候的nltk代码需要语料库才能运行,nltk语料库很庞大,这时候运行下面的python代码,就会下载语料库

 

import nltknltk.download()

 

不过经常因为网络问题导致语料库无法下载下来,这时候需要我们手动下载并配置语料库

 

大邓已经将语料库资源放到百度网盘,链接:https://pan.baidu.com/s/13DXmvAuGtEHjXIV-UK6swQ  密码:9pzp

 

下载并解压,得到nltk_data文件夹
,现在我们要知道nltk_data文件夹应该放置的位置(路径), 运行下面代码即可得到nltk_data在本机中放置的位置

 

import nltknltk.data.find(".")

 

Run

 

FileSystemPathPointer('/Users/电脑用户忙/nltk_data')

 

我们将nltkdata文件夹放到对应的路径(/Users/电脑用户忙/nltk_data),nltk配置完成~

 

spacy配置

 

安装spacy库,命令行输入以下命令

 

pip3 install spacy

 

通nltk类似,spacy很多的代码运行时候需要用到训练好的模型,模型列表https://spacy.io/models

 

English

 

Chinese

 

German

 

French

 

Spanish

 

Portuguese

 

Italian

 

Dutch

 

Greek

 

Multi-language

 

我们以中文为例。

 

spacy有4种英文模型 https://spacy.io/models/zh ,本文使用zh_core_web_sm
模型作为案例进行安装

 

打开 https://github.com/explosion/spacy-models/releases/download/zh_core_web_sm-3.1.0/zh_core_web_sm-3.1.0-py3-none-any.whl 网页下载zh_core_web_sm-3.1.0-py3-none-any.whl
文件链接进行下载。

 

下载完成后将其移动至桌面,方面安装。

 

打开命令行,切换至桌面

 

#mac
#cd desktop
#Win
cd Desktop

 

命令行中安装模型

 

pip3 install h_core_web_sm-3.1.0-py3-none-any.whl

 

注意spacy使用时候需要声明使用的模型

 

import spacy
nlp_model = spacy.load('zh_core_web_sm')

 

之后就可以愉快的使用nltk和spacy

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注