Python3下的NLTK及nltk_data安装问题(Ubuntu环境)

简介: Python3下的NLTK及nltk_data安装问题(Ubuntu环境) 测试环境:Ubuntu Kylin 14.04 Python版本:3.4.3 在使用Python强大的第三方库nltk进行一些自然语言处理工作的时候遇到了一些困难,折腾一番总算解决。

Python3下的NLTK及nltk_data安装问题(Ubuntu环境)

测试环境:Ubuntu Kylin 14.04

Python版本:3.4.3



在使用Python强大的第三方库nltk进行一些自然语言处理工作的时候遇到了一些困难,折腾一番总算解决。现在在这里记录一下,当作备忘。



网上找到挺多安装nltk的教程,但经测试,好像都是适用于Python2的,对于Python3,就勉为其难了。这里的主要问题是,前辈们分享的nltk_data包是不兼容Python3的。



所以我的解决方案是:

到https://github.com/nltk/nltk_data下载gh-pages分支,里面的Packages就是我们要的资源。(注:截至2016年3月24日时本方案仍有效)



详细情况记录如下:

1.安装nltk。截至今天,安装的是nltk3.2,在有pip这些工具的情况下,安装这些库变得非常简单:

pip install nltk

另外官方的安装说明还附带了numpy,一个“赛Matlab的Python开源的数值计算扩展库”,说不定以后用得上:

pip install numpy





2.安装nltk_data。nltk_data是必要的nltk数据包,实现分词,词性标注,命名实体识别等功能都要用到这个数据包:

进入Python Shell后只需要两句就可以进入nltk_data的下载

$python

>>>import nltk

>>>nltk.download()

然后就可以按提示进行了。



重点是,下载会很慢或干脆卡住。此时需要手动下载nltk_data包。



下载方法:到https://github.com/nltk/nltk_data下载gh-pages分支,里面的Packages就是我们要的资源。


里面有部分是压缩包,需要解压。


将Packages文件夹改名为nltk_data,放在以下任一路径:
/usr/lib
/usr/local/lib
用户目录(比方说可能是/home/bennu)
其他nltk可以识别的路径,出错时有可能会在出错信息看到。


链接: https://pan.baidu.com/s/1UfJhJY9bJ9hqeTuzKxgQvw 密码: 2ce5




剩下就是继续努力学习了~

--------------------- 
作者:BennuChan 
来源:CSDN 
版权声明:本文为博主原创文章,转载请附上博文链接!
相关文章
|
1月前
|
Unix Shell Linux
赞!优雅的Python多环境管理神器!易上手易操作!
赞!优雅的Python多环境管理神器!易上手易操作!
|
2月前
|
IDE Linux 开发工具
技术小白如何配置Python环境
技术小白如何配置Python环境
|
3月前
|
IDE Ubuntu Java
百度搜索:蓝易云【Ubuntu快速搭建单步调试openjdk环境】
现在,你已经成功在Ubuntu上搭建了OpenJDK的单步调试环境,可以使用Eclipse IDE方便地进行Java程序的调试。请注意,Eclipse IDE提供了丰富的调试功能,使得调试过程更加高效和准确。
26 0
|
3月前
|
机器学习/深度学习 并行计算 算法框架/工具
在Python中进行深度学习环境准备
在Python中进行深度学习环境准备
51 4
|
3天前
|
缓存 自然语言处理 数据处理
Python自然语言处理面试:NLTK、SpaCy与Hugging Face库详解
【4月更文挑战第16天】本文介绍了Python NLP面试中NLTK、SpaCy和Hugging Face库的常见问题和易错点。通过示例代码展示了如何进行分词、词性标注、命名实体识别、相似度计算、依存关系分析、文本分类及预训练模型调用等任务。重点强调了理解库功能、预处理、模型选择、性能优化和模型解释性的重要性,帮助面试者提升NLP技术展示。
20 5
|
15天前
|
Ubuntu 开发工具 git
ubuntu18.04下配置muduoC++11环境
以上步骤将在Ubuntu 18.04下配置C++11环境,并编译安装muduo库。请根据实际情况对配置步骤进行调整。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
15 0
|
15天前
|
数据采集 JavaScript C++
Python搭建编程环境-安装Python3解释器
Python搭建编程环境-安装Python3解释器
24 1
|
17天前
|
Ubuntu Python
WSL ubuntu 20.04安装python3
通过以上步骤,你可以在WSL的Ubuntu 20.04上成功安装Python 3。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
19 1
|
18天前
|
jenkins 测试技术 持续交付
软件测试|docker搭建Jenkins+Python+allure自动化测试环境
通过以上步骤,你可以在Docker中搭建起Jenkins自动化测试环境,实现Python测试的自动化执行和Allure报告生成。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
38 6
|
1月前
|
Shell Python Windows
通过Python实现win11环境下FTP的上传与下载
通过Python实现win11环境下FTP的上传与下载