Dou's Blog

Just For Fun


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

  • 公益404

  • 搜索

一个简单的验证码识别

发表于 2017-07-04 | 分类于 技术 | 阅读次数
| 字数统计 564字 | 阅读时长 2分钟
一个验证码识别实验,欢迎star。https://github.com/xiaodouhua/captcha_recognition实验用到的库主要是sklearn,建议下载anaconda即可 实验主要工作有以下几点: 批量下载验证码 验证码的处理,包括:去噪音,灰度化,二值化,切割 用svm+ ...
阅读全文 »

统计学习方法6_决策树

发表于 2017-07-01 | 分类于 读书 | 阅读次数
| 字数统计 2,496字 | 阅读时长 9分钟
决策树决策树(decision tree)是一种基本的分类与回归方法,这里主要讨论用于分类的决策树。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要的有点是模型具有可读性,分类速度快,学习时利用训练数据,根据损失函数最小化的原则简历决策树模型。决策树的 ...
阅读全文 »

统计学习方法5_朴素贝叶斯法

发表于 2017-05-02 | 分类于 读书 | 阅读次数
| 字数统计 532字 | 阅读时长 2分钟
朴素贝叶斯法朴素贝叶斯 (naive Bayes) 法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出Y。 朴素贝叶斯法的学习与分类基本方法 朴素贝叶斯法通过 ...
阅读全文 »

统计学习方法4_K近邻法

发表于 2017-05-01 | 分类于 读书 | 阅读次数
| 字数统计 2,057字 | 阅读时长 7分钟
K近邻法k近邻法(k-nearest neighbor, k-NN)是一种基本分类与回归方法。这里只讨论分类问题中的k近邻法。k近邻法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k近邻法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训 ...
阅读全文 »

统计学习方法3_感知机

发表于 2017-04-26 | 分类于 读书 | 阅读次数
| 字数统计 837字 | 阅读时长 3分钟
感知机感知机(perception)是一种二类分类的线性分类模型输入:实例的特征向量输出:实例的类别(+1,-1)感知机:输入空间中将实例划分为正负两类的分离超平面,属于判别模型感知机学习目的:求出将训练数据进行线性划分的分离超平面方法:导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化, ...
阅读全文 »

统计学习方法2

发表于 2017-04-23 | 分类于 读书 | 阅读次数
| 字数统计 1,374字 | 阅读时长 5分钟
监督学习的目的是找到一个输入输出映射(模型),使得这个模型不仅对训练数据有很好的拟合能力,对于未知数据,它也有很好的预测能力。这篇博客介绍选择和评估模型的标准。本篇博客一共有以下几个重点:训练误差与测试误差、泛化能力、过拟合。 训练误差与测试误差训练误差是模型$Y={\hat{f}}(X))$关于训 ...
阅读全文 »

统计学习方法1

发表于 2017-04-22 | 分类于 读书 | 阅读次数
| 字数统计 1,476字 | 阅读时长 5分钟
统计学习方法=模型+策略+方法统计学习方法之间的不同,主要来自于其模型、策略、算法的不同。确定了模型、策略和算法,统计学习方法也就确定了。 Note: 以下以监督学习为基础来进行论述。非监督学习和强化学习同样也拥有这三要素。 模型在监督学习当中,我们的目的是学习一个由输入到输出的映射,这个映射就 ...
阅读全文 »

几道面试笔试题

发表于 2017-04-06 | 分类于 技术 | 阅读次数
| 字数统计 1,441字 | 阅读时长 5分钟

老鼠喝药问题

问题:

有 1000 个一模一样的瓶子,其中有 999 瓶是普通的水,有一瓶是毒药。任何喝下毒药的生物都会在一星期之后死亡。现在,你只有 10 只小白鼠和一星期的时间,如何检验出哪个瓶子里有毒药?

阅读全文 »

python学习笔记

发表于 2016-11-21 | 分类于 技术 | 阅读次数
| 字数统计 770字 | 阅读时长 3分钟

综述

应用场景:
首选是网络应用,包括网站、后台服务等等;其次是许多日常需要的小工具,包括系统管理员需要的脚本任务等等;另外就是把其他语言开发的程序再包装起来,方便使用。

优缺点:
优点:“优雅”、“明确”、“简单”、“内置电池( batteries included)”(各种库),所以开发速度快。
缺点:运行慢,源码公开。

阅读全文 »

git与github学习

发表于 2016-10-11 | 分类于 技术 | 阅读次数
| 字数统计 1,473字 | 阅读时长 6分钟

别说话,就是干。

  • [x] 安装
  • [x] 命令的学习
  • [x] 与github关联push
  • [x] git原理的学习
    阅读全文 »
12
Dou

Dou

爱生活,爱编程

14 日志
2 分类
9 标签
Weibo GitHub
左边太空了,加点链接(不愿意的说一声蛤)
  • kiwi-yan
  • zjf
  • anyaojun
  • hxudong
© 2016 - 2017 Dou
由 Hexo 强力驱动
主题 - NexT.Pisces
博客全站共16.6k字