由于最近需要做项目,需要进行分词等,查了资料之后,发现python NLTK很强大,于是就想试试看。在网上找了很多安装资料,都不太完整,下载的时候也总是会出现一点小意外,最后终于也安装成功了,所以分享下经验。
初学者,请高手指出不合理的地方。
我的工作站环境是Win10 64 + Python 2.7.12 64 bit。
按照NLTK上安装主页上的指引如下:
Source installation (for 32-bit or 64-bit Windows) 1.Install Python: http://www.python.org/download/releases/2.7.3/ 2.Install Numpy (optional): http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 3.Install Setuptools: http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe 4.Install Pip: Start>Run... c:\Python27\Scripts\easy_install pip 5.Install PyYAML and NLTK: Start>Run... c:\Python27\Scripts\pip install pyyaml nltk 6.Test installation: Start>All Programs>Python27>IDLE, then type import nltk
前3步的安装都比较简单,如果为了更好的编辑,也可以安装一下编辑软件,如PyCharm,Sublime text2/3等等。在安装的时候要注意安装路径,最好不要出现中文。
我在安装第4步的时候出现了一点小问题,执行命令后报错:Python version 2.7 required, which was not found in the registry,于是我又到网上查了资料,解决方法是:
1)自己新建一个register.py文件,在文件中复制黏贴以下内容,然后保存到自己的路径,我是直接放到pyhon的安装文件夹中;
# # script to register Python 2.0 or later for use with win32all # and other extensions that require Python registry settings # # written by Joakim Loew for Secret Labs AB / PythonWare # # source: # http://www.pythonware.com/products/works/articles/regpy20.htm # # modified by Valentine Gogichashvili as described in http://www.mail-archive.com/distutils-sig@python.org/msg10512.html import sys from _winreg import * # tweak as necessary version = sys.version[:3] installpath = sys.prefix regpath = "SOFTWARE\\Python\\Pythoncore\\%s\\" % (version) installkey = "InstallPath" pythonkey = "PythonPath" pythonpath = "%s;%s\\Lib\\;%s\\DLLs\\" % ( installpath, installpath, installpath ) def RegisterPy(): try: reg = OpenKey(HKEY_CURRENT_USER, regpath) except EnvironmentError as e: try: reg = CreateKey(HKEY_CURRENT_USER, regpath) SetValue(reg, installkey, REG_SZ, installpath) SetValue(reg, pythonkey, REG_SZ, pythonpath) CloseKey(reg) except: print "*** Unable to register!" return print "--- Python", version, "is now registered!" return if (QueryValue(reg, installkey) == installpath and QueryValue(reg, pythonkey) == pythonpath): CloseKey(reg) print "=== Python", version, "is already registered!" return CloseKey(reg) print "*** Unable to register!" print "*** You probably have another Python installation!" if __name__ == "__main__": RegisterPy()
2)Ctrl+R打开cmd,然后进入python的安装目录(如果有配置环境变量的话,就不用这么麻烦了,可以直接命令操作),输入:python register.py(这个是刚才存错register.py的路径,如D:\register.py)。出现Python 2.7 is already registered!则表示配置成功。
3)接着,进入Scripts目录,输入:easy_install pip,提示安装成功。
第5步是安装PyYAML和NLTK。直接在刚才的目录中输入:pip install pyyaml nltk,这时会提示安装是否成功,若安装成功可以接着下一步。
此时,就可以到IDLE中进行下载NLTK的数据包:
稍等一会,就出现了如下的页面,弹出如下窗口,即完成了。我是选择下载了所有的data,你可以根据自己的需要进行下载。要等很久才会完成这个过程,慢慢来,最后就可以测试啦。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]