自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee的博客

咨询交流请加群:955817470,GitHub:https://github.com/Asia-Lee

原创 Pandas删除某列包含特殊字符的行

目录 1、测试文件(test_data.xlsx)数据 2、删除type列中包含"未知"的所有行 1、测试文件(test_data.xlsx)数据 2、删除type列中包含"未知"的所有行 # -*- coding: utf-8 -*- i...

2018-08-30 21:06:06 24693 8

原创 TF-IDF算法介绍及实现

目录 1、TF-IDF算法介绍 (1)TF是词频(Term Frequency) (2) IDF是逆向文件频率(Inverse Document Frequency) (3)TF-IDF实际上是:TF * IDF 2、TF-IDF应用 3、Python3实现TF-IDF算法 4、NL...

2018-08-07 19:17:45 87721 25

原创 逻辑回归算法——处理简单数据

代码实现 (1)数据处理;   (2)sigmoid函数;  (3)梯度上升算法;  (4)改进的随机梯度上升算法;  (5)绘图 # -*- coding:UTF-8 -*- import matplotlib.pyplot as plt import numpy as np import...

2018-08-05 12:07:50 2434 0

原创 SVM算法——实现手写数字识别(Sklearn实现)

1、Sklearn.svm学习       数据集下载:trainingDigits训练集下载 , testDigits测试集下载       详细数据介绍参看:KNN算法实现手写数字识别 2、代码实现  # -*- coding: UTF-8 -*- import numpy as n...

2018-08-04 17:09:35 7098 6

原创 朴素贝叶斯算法——实现新闻分类(Sklearn实现)

目录 1、朴素贝叶斯实现新闻分类的步骤 2、代码实现 1、朴素贝叶斯实现新闻分类的步骤 (1)提供文本文件,即数据集下载 (2)准备数据 将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化 停用词文本stopw...

2018-08-01 13:06:25 3580 0

提示
确定要删除当前文章?
取消 删除