AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 527388
Accepted
jk - Reinstate Monica
jk - Reinstate Monica
Asked: 2014-09-24 01:04:46 +0800 CST2014-09-24 01:04:46 +0800 CST 2014-09-24 01:04:46 +0800 CST

Ubuntu 12.04 LTS 上的 python-nltk:nltk.download('brown') 导致 HTML 错误 401

  • 772

我已经使用 apt-get 在 Ubuntu Server 12.04 上安装了 python-nltk。

但是当我尝试下载语料库时,出现以下错误:

$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data]     Required
False

我是否缺少某些配置或附加包?

12.04
  • 3 3 个回答
  • 9259 Views

3 个回答

  • Voted
  1. Best Answer
    Sylvain Pineau
    2014-09-24T02:21:25+08:002014-09-24T02:21:25+08:00

    Ubuntu打包版的DEFAULT_URLused indownloader.py依然使用:

    DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'
    

    但是当前的数据服务器是:

    DEFAULT_URL = "http://nltk.github.com/nltk_data/"
    

    您当然可以从源代码安装或...修改您已安装的版本以指向新服务器,如下所示:

     sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py
    

    然后你可以安装“棕色”语料库:

    $ python
    Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
    [GCC 4.8.2] on linux2
    Type "help", "copyright", "credits" or "license" for more information.
    >>> import nltk
    >>> nltk.download('brown')
    [nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
    [nltk_data]   Unzipping corpora/brown.zip.
    True
    >>> from nltk.corpus import brown
    >>> brown.words()
    ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
    >>> 
    
    • 12
  2. Logic Knight
    2014-10-18T14:25:46+08:002014-10-18T14:25:46+08:00

    可以在不更改源代码的情况下修复此问题。在 python 中创建自定义下载器:

    >>> dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")
    

    然后打开一个 GUI 对话框:

    >>> dl.download()
    

    检查您是否具有下载目录的写入权限并下载您需要的内容。

    • 12
  3. machineo
    2015-11-09T01:42:14+08:002015-11-09T01:42:14+08:00
    pip install nltk --upgrade
    

    这个更新 nltk 然后nltk.download()再次工作。

    • 0

相关问题

  • 跨(全屏)应用程序拖放,通过 Alt-Tab 切换

  • Guake 终端在 Unity 中显示错误

  • 字体损坏:通过字符的行

  • 使用活动应用程序自动切换到工作区

  • 如何查看实际内存及其属性(插槽位置、大小、速度...)

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve