Python

吴裕雄--天生自然python机器学习:Logistic回归

假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数...

吴裕雄--天生自然python机器学习:使用朴素贝叶斯过滤垃圾邮件

使用朴素贝叶斯解决一些现实生活中的问题时,需要先从文本内容得到字符串列表,然后生成词向量。准备数据:切分文本测试算法:使用朴素贝叶斯进行交叉验证文件解析及完整的垃圾邮件测试函数defcreateVocabList(dataSet):vocabSet=set([])#createemptysetfordocumentin...

吴裕雄--天生自然python机器学习:朴素贝叶斯算法

分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。概率论是许多机器学习算法的基础在计算特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,就得到了特征取该值的概率。首先从一个最简单的概率分类器开始,然后...

吴裕雄--天生自然python机器学习:使用决策树预测隐形眼镜类型

解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据集,我们就可以利用决策树学到很多知识:眼科医生是如何判断患者需要佩戴的镜片类型;一旦理解了决策树的工作原理,我们甚至也可以帮助人们判断需要佩戴的镜片类型。    隐形眼镜数据集是非常著名的数据集,它包含很多患者眼部状况的观察条...

吴裕雄--天生自然python机器学习:决策树算法

我们经常使用决策树处理分类问题’近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。 K-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内在含义,决策树的主要优势就在于数据形式非常容易...

吴裕雄--天生自然python机器学习:KNN-近邻算法在手写识别系统上的应用

需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小®:宽髙是32像素*32像素的黑白图像。尽管采用文本格式存储图像不能有效地利用内存空间,但是为了方便理解,我们还是将图像转换为文本格式。    准备数据:将图像转换为测试向量每个数字大约有200个样本;目录中包...

吴裕雄--天生自然python机器学习:使用K-近邻算法改进约会网站的配对效果

在约会网站使用K-近邻算法   准备数据:从文本文件中解析数据海伦收集约会数据巳经有了一段时间,她把这些数据存放在文本文件(1如1^及抓比加中,每个样本数据占据一行,总共有1000行。海伦的样本主要包含以下3种特征:每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数将文...

吴裕雄--天生自然python机器学习:K-近邻算法介绍

k-近邻算法概述简单地说,谷近邻算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关...

吴裕雄--天生自然python机器学习:机器学习简介

除却一些无关紧要的情况,人们很难直接从原始数据本身获得所需信息。例如,对于垃圾邮件的检测,侦测一个单词是否存在并没有太大的作用,然而当某几个特定单词同时出现时,再辅以考察邮件长度及其他因素,人们就可以更准确地判定该邮件是否为垃圾邮件。简单地说,机器学习就是把无序的数据转换成有用的信息。机器学习横跨计算机科学、工程技术和...

吴裕雄--天生自然python学习笔记:python 用pyInstaller模块打包文件

要想在没有安装Python集成环境的电脑上运行开发的Python程序,必须把Python文件打包成.exe格式的可执行文件。Python的打包工作PyInstaller提供了两种把.py文件包成.exe文件的方式:第一种方式是把由.py文件打包而成的.exe文件及相关文件放在一个目录中。这种方式是默认方式,称为oned...

吴裕雄--天生自然python学习笔记:python 用pygame模块开发俄罗斯方块游戏

俄罗斯方块游戏多年前,游戏机中最流行的游戏就是“俄罗斯方块”了。时至今日,虽然网络游戏日新月异,但“俄罗斯方块”这款小游戏仍在许多人心中占有一席之地。本例中,我们将亲手设计一个简单的俄罗斯方块游戏。应用程序总览开始时游戒窗门的下方会显示“单击鼠标左键开始游戏&...

吴裕雄--天生自然python学习笔记:python 用pygame模块检测键盘事件和鼠标事件

用户可通过键盘输入来操控游戏中角色的运动,取得键盘事件的方法有以下两种:      常用的按键与键盘常数对应表:按下右箭头键,蓝色小球会向右移动:按住右箭头键不放,球体会快速向右移动,若到达边界则停止移动:按左箭头键,蓝色小球会向左移动,到达边界则停止。&nb...

吴裕雄--天生自然python学习笔记:python 用pygame模块角色类(Sprite)移动与碰撞

角色类(Sprite)Pygame游戏中有许多组件会重复用到,比如射击宇宙飞船的游戏中,外星宇宙飞船可能多达数十艘,通过创建“角色类”,可以生成多个相同的对象。Pygame角色类是游戏设计者最喜爱的功能,它不但能复制多个对象,还能进行动画给制、碰撞侦测等。创建角色类的基本语法为: &n...

吴裕雄--天生自然python学习笔记:python 用pygame模块动画一让图片动起来

动画是游戏开发中不可或缺的要素,游戏中的角色只有动起来才会拥有“生命”,但动画处理也是最让游戏开发者头痛的部分。Pygame包通过不断重新绘制绘图窗口,短短几行代码就可以让图片动起来!动画处理程序的基本架构importpygamepygame.init()screen=pygame.displa...

吴裕雄--天生自然python学习笔记:python 用pygame模块加载图片

加载图片使用几何绘图无法画出精细的图形,所以我们可以把现成的图片加载到Pygame中直接使用。加载图片的语法为:图片加载后通常会用convert方法加以处理,以增加显示速度,语法为:例如,载入media文件夹中的imgOl.jpg图片文件井保存至image变量:    impor...