自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee的博客

咨询交流请加群:955817470,GitHub:https://github.com/Asia-Lee

原创 NLP词向量和句向量方法总结及实现

目录 一、Word2Vec 1、Word2Vec介绍 2、Gensim实现Word2Vec 3、基于Word2Vec的句向量 4、基于加权Word2Vec的句向量 5、基于Word2Vec的文本向量化实现 二、GloVe 1、GloVe介绍 2、基于源码的GloVe词向量生成(L...

2019-08-29 22:33:02 9299 6

原创 基于树模型的lightGBM文本分类

目录 1、基于TF的关键词提取 2、根据词频将文本转化为向量 3、基于树模型的重要特征选择 5、完整代码实现 6、分类结果 1、基于TF的关键词提取 使用TF词频对训练集clean_data_train进行关键词提取,选取topK个关键词作为特征词,即topK=10000。 # ...

2019-08-28 21:42:42 1926 1

原创 算法岗面试知识点总结

目录 一、机器学习知识点 二、深度学习知识点 一、机器学习知识点 1、交叉熵公式,逻辑回归(LR)公式,逻辑回归损失函数,SVM的损失函数 2、逻辑回归(LR)和线性回归的区别 线性回归用来做预测,LR用来做分类;线性回归是来拟合函数,LR是来预测函数;线性回归用最小二乘法来计算参数,...

2019-08-05 21:10:10 1653 3

原创 字符串自动校对——2019字节跳动笔试题目

字符串自动校对(修正拼写错误字符串) 题目描述:(1)三个同样的字母连在一起,一定是拼写错误,去掉一个就好了,比如:helllo->hello;(2)两对一样的字母(AABB型)连在一起,一定是拼写错误,去掉第二对的一个字母就好了:比如:helloo->hello;(3)上面的规则优...

2019-08-04 20:04:28 4348 0

提示
确定要删除当前文章?
取消 删除