题记: 由于现在的项目是搜索引擎,所以不由的对自然语言处理产生了好奇,再加上一直以来都想学Python,只是没有机会与时间。碰巧这几天在亚马逊上找书时发现了这本《Python自然语言处理》,瞬间觉得这对我同时入门自然语言处理与Python有很大的帮助。所以最近都会学习这本书,也写下这些笔记。
NLTK模块及功能介绍
我的Python版本是2.7.5,NLTK版本2.0.4
安装步骤跟http://www.nltk.org/install.html 一样
1. 安装Setuptools:
在页面的最下面setuptools-5.7.tar.gz
2. 安装 Pip: 运行
3. 安装 Numpy (optional): 运行
4. 安装 NLTK: 运行
当出现以下界面进行nltk_data的下载
也可直接到 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 去下载数据包,并拖到Download Directory。我就是这么做的。
最后在Python目录运行以下命令以及结果,说明安装已成功
现在开始进入正题,由于本人没学过python,所以使用NLTK也就是学习Python的过程。初次学习NLTK主要使用的时NLTK里面自带的一些现有数据,上图中已由显示,这些数据都在nltk.book里面。
3.1 搜索文本
concordance:搜索text1中的monstrous
similar:查找text1中与monstrous相关的所有词语
dispersion_plot:用离散图判断词在文本的位置即偏移量
3.2 计数词汇
len:获取长度,即可获取文章的词汇个数,也可获取单个词的长度
sorted:排序
3.3 频率分布
3.4 细粒度的选择词
3.5 词语搭配和双连词
用bigrams()可以实现双连词
3.6 NLTK频率分类中定义的函数
最后看下text1的类情况. 使用type可以查看变量类型,使用help()可以获取类的属性以及方法。以后想要获取具体的方法可以使用help(),这个还是很好用的。
1. 词意消歧
2. 指代消解
3. 自动生成语言
4. 机器翻译
5. 人机对话系统
6. 文本的含义
虽然是初次接触Python,NLTK,但是我已经觉得他们的好用以及方便,接下来就会深入的学习他们。
以上就是本篇文章【Python之NLP(转)】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/quote/3764.html 行业 资讯 企业新闻 行情 企业黄页 同类资讯 网站地图 返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多