#百面

《百面机器学习》拾贝----第六章:概率图模型

如果用一个词来形容概率图模型(ProbabilisticGraphicalModel)的话,那就是“优雅”。...

《百面机器学习》拾贝----第五章:非监督学习

相比于监督学习,非监督学习的输入数据没有标签信息,需要通过算法模型来挖掘数据内在的结构和模式。非监督学习主要包含两大类学习方法:数据聚类和特征变量关联。其中,聚类算法往往是通过多次迭代来找到数据的最优分割,而特征变量关联则是利用各种相关性分析方法来找到变量之间的关系。01K均值聚类与分类问题不同,聚类是在事先并不知道任...

《百面机器学习》拾贝----第四章:降维

宇宙,是时间和空间的总和。时间是一维的,空间。。。maybe9or10维?降维,即用一个低维度的向量表示原始高维度的特征。常见的降维方法有主成分分析、线性判别分析、等距映射、局部线性嵌入、拉普拉斯特征映射、局部保留投影等。01PCA最大方差理论在机器学习领域中,我们对原始数据进行特征提取,有时会得到比较高维的特征向量。...

《百面机器学习》拾贝----第三章:经典算法

不忘初心,方得始终.01 支持向量机支持向量机(SupportVectorMachine,SVM)是众多监督学习方法中十分出色的一种,几乎所有讲述经典机器学习方法的教材都会介绍。关于SVM,流传着一个关于天使与魔鬼的故事。以下关于SVM的介绍很生动:传说魔鬼和天使玩了一个游戏,魔鬼在桌上放了两种颜色的球,如图...

《百面机器学习》拾贝----第二章:模型评估

第2章模型评估“没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习...

《百面机器学习》拾贝----第一章:特征工程

>>>前言人工智能技术正在对社会结构、职场、教育等带来革命性的变化。未来几年是人工智能技术全面普及化的时期,也是该技术的相关人才最为稀缺的时期。人工智能泛指让机器具有人的智力的技术。这项技术的目的是使机器像人一样感知、思考、做事、解决问题。人工智能是一个宽泛的技术领域,包括自然语言理解、计算机视觉、机...

百面机器学习读书笔记

P002----零均值归一化,思考,为什么归一化公式要除以标准差σ? 首先,了解标准差的定义:方差的平方根,那方差又是什么?方差描述了随机变量X与期望值的偏离程度,目的是为了展示随机变量X取值的离散程度。那什么是随机变量?它与变量的区别在哪里?个人理解如下:简单地说,随机变量是指随机事件的数量表现...