51dev.com IT技术开发者社区

51dev.com 技术开发者社区

机器学习特征选择之卡方检验与互信息

机器学习特征选择之卡方检验与互信息

特征选择的主要目的有两点:1.      减少特征数量提高训练速度,这点对于一些复杂模型来说尤其重要2.      减少noisefeature以提高模型在测试集上的准确性。一些噪音特征会导致模型出现...

机器学习】【决策树】用样本集详解并计算:信息+香农熵+条件熵+信息增益+信息增益比+决策树的最优根节点+经验熵+经验条件

机器学习】【决策树】用样本集详解并计算:信息+香农熵+条件熵+信息增益+信息增益比+决策树的最优根节点+经验熵+经验条件

首先信息、香农熵、条件熵、信息增益都是信息论里面的概念。本文章的讲解和代码实现(除了条件熵和信息增益)都基于两个随机变量的样本空空间,样本空间X={x1,x2}的概率分布如下所示:p(x1)=p1,0<p1<1p(x2)=p2,0<p2<1p1+p2=1信息是用来消除随机不确定性的东西,信息的公...

机器学习算法之决策树

机器学习算法之决策树

决策树是一种简单高效并且具有强解释性的模型,广泛应用于数据分析领域。其本质是一颗由多个判断节点组成的树,如:决策树 在使用模型进行预测时,根据输入参数依次在各个判断节点进行判断游走,最后到叶子节点即为预测结果。决策树算法的核心是通过对数据的学习,选定判断节点,构造一颗合适的决策树。假设我们从用户行为日志中整理...

一文看懂区块链架构设计

一文看懂区块链架构设计

区块链作为一种架构设计的实现,与基础语言或平台等差别较大。区块链是加密货币背后的技术,是当下与VR虚拟现实等比肩的热门技术之一,本身不是新技术,类似Ajax,可以说它是一种技术架构,所以我们从架构设计的角度谈谈区块链的技术实现。无论你擅长什么编程语言,都能够参考这种设计去实现一款区块链产品。与此同时,梳理与之相关的知识...

一文读懂区块链技术逻辑和原理

一文读懂区块链技术逻辑和原理

区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法。区块链(Blockchain)是比特币的一个重要概念,货币联合清华大学五道口金融学院互联网金融实验室、新浪科技发布的《2014—2016全球比特币发展研究...

Theano Multi Layer Perceptron 多层感知机

Theano Multi Layer Perceptron 多层感知机

理论机器学习技法:https://www.coursera.org/course/ntumltwo  Theano代码#!/usr/bin/envpython#-*-encoding:utf-8-*-'''ThisisdonebyVincent.Ymainlymodifiedfromdeeplear...

Python在大数据分析及机器学习中的兵器谱

Python在大数据分析及机器学习中的兵器谱

1.网页爬虫工具集Scrapy推荐大牛pluskid早年的一篇文章:《Scrapy轻松定制网络爬虫》BeautifulSoup客观的说,BeautifuSoup不完全是一套爬虫工具,需要配合urllib使用,而是一套HTML/XML数据分析,清洗和获取工具。Python-GooseGoose最早是用Java写得,后来用...