我已经使用 apt-get 在 Ubuntu Server 12.04 上安装了 python-nltk。
但是当我尝试下载语料库时,出现以下错误:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
我是否缺少某些配置或附加包?
Ubuntu打包版的
DEFAULT_URL
used indownloader.py
依然使用:但是当前的数据服务器是:
您当然可以从源代码安装或...修改您已安装的版本以指向新服务器,如下所示:
然后你可以安装“棕色”语料库:
可以在不更改源代码的情况下修复此问题。在 python 中创建自定义下载器:
然后打开一个 GUI 对话框:
检查您是否具有下载目录的写入权限并下载您需要的内容。
这个更新 nltk 然后
nltk.download()
再次工作。