自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee的博客

咨询交流请加群:955817470,GitHub:https://github.com/Asia-Lee

原创 NLP常见语言模型总结

目录 一、词的离散表示 1、One-hot编码(独热编码) 2、Bag of Words(BOW,词袋模型) 3、N-gram语言模型 二、词的分布式表示(Distributed Representation) 1、共现矩阵(Co-currence Matrix) 2、神经网络语言模...

2019-01-19 10:35:19 4055 0

原创 英文文本分类——电影评论情感判别

目录 1、导入所需的库 2、用Pandas读入训练数据 3、构建停用词列表数据 4、对数据做预处理 5、将清洗的数据添加到DataFrame里 6、计算训练集中每条评论数据的向量 7、构建随机森林分类器并训练 8、读取测试数据并进行预测 9、将预测结果写入csv文件 1、导入所...

2019-01-15 18:12:21 3044 7

原创 中文文本分类——商品评论情感判别

目录 1、数据集下载 2、载入数据,做预处理(分词),切分训练集与测试集 3、计算训练集和测试集每条评论数据的向量并存入文件 4、获得训练集向量和标签,测试集向量和标签 5、训练SVM模型 6、构建待遇测句子的向量 7、对单个句子进行情感判断 1、数据集下载 商品(书籍、酒店、计...

2019-01-14 21:08:51 3445 15

原创 NLTK使用方法总结

目录 1. NLTK安装与功能描述 2. NLTK词频统计(Frequency) 3. NLTK去除停用词(stopwords) 4. NLTK分句和分词(tokenize) 5. NLTK词干提取 (Stemming) 6. NLTK词形还原(Lemmatization) 7.NL...

2019-01-07 15:06:55 7543 0

原创 NLP学习路线总结

目录 1、自然语言处理概述 2、自然语言处理入门基础 3、自然语言处理的主要技术范畴 4、自然语言处理基本点 5、特征处理 6、模型选择 7、NLP常用工具 8、NLP语言模型 9、快速入门NLP方法 10、自然语言处理学习资料 1、自然语言处理概述 自然语言处理(Natu...

2019-01-03 16:56:51 13290 3

提示
确定要删除当前文章?
取消 删除