Pertanyaan python-nltk pada Ubuntu 12.04 LTS: nltk.download ('coklat') menghasilkan kesalahan HTML 401


Saya telah menginstal python-nltk pada Ubuntu Server 12.04 menggunakan apt-get.

Tetapi ketika saya mencoba mengunduh korpus, saya mendapatkan kesalahan berikut:

$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data]     Required
False

Apakah saya kehilangan beberapa konfigurasi atau paket tambahan?


9
2017-09-23 09:04


asal


Anda dapat mencoba menginstal dari sumber wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install. Namun masalah telah muncul github.com/nltk/nltk/issues/747 - alvas
Ini masih masalah dengan Ubuntu 13.04 - Tickon


Jawaban:


Itu DEFAULT_URL Digunakan dalam downloader.py dari versi paket Ubuntu masih menggunakan:

DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'

Tetapi server data saat ini adalah:

DEFAULT_URL = "http://nltk.github.com/nltk_data/"

Anda tentu saja dapat menginstal dari sumber atau ... mengubah versi Anda yang sudah diinstal untuk menunjuk ke server baru seperti ini:

 sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py

Anda kemudian dapat menginstal korpus "coklat":

$ python
Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
[nltk_data]   Unzipping corpora/brown.zip.
True
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
>>> 

12
2017-09-23 10:21





Anda dapat memperbaikinya tanpa mengubah kode sumber. Buat pengunduh khusus dengan python:

>>> dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")

kemudian Anda membuka dialog GUI:

>>> dl.download()

Periksa Anda memiliki akses tulis ke direktori unduhan dan unduh apa yang Anda butuhkan.


12
2017-10-17 22:25





pip install nltk --upgrade

Yang ini memperbarui nltk dan kemudian nltk.download() bekerja kembali.


0
2017-11-08 09:42