51dev.com IT技术开发者社区

51dev.com 技术开发者社区

中文自然语言处理数据集:ChineseNLPCorpus

中文自然语言处理数据集:ChineseNLPCorpus

据集的相关链接,可以用来练手:https://github.com/InsaneLife/ChineseNLPCorpus 以下来自该项目介绍页中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。 文本分类 新闻分类今日头条中文新闻(短文本)分类数据集:htt...

特征抽取之信息增益

特征抽取之信息增益

在前面的《文本分类概述》文章中,我们讲到了基于统计学习的方法进行分类的关键在于对训练集语料的特征选择的好坏。那么训练集中哪些词可以作为特征,哪些词则不能呢?我们必须对训练集中所有词语量化其重要程度。信息增益 (IG,InformationGain ) 就是一种很有效的特...

不用写代码就能实现深度学习?手把手教你用英伟达 DIGITS 解决图像分类问题

不用写代码就能实现深度学习?手把手教你用英伟达 DIGITS 解决图像分类问题

英伟达想必大家都有所耳闻,但对英伟达开发的深度学习训练系统(NVIDIADeepLearningGPUTrainingSystem,DIGITS)知之甚少,今天我们介绍如何使用DIGITS,实现基于深度神经网络的图像分类,包括数据集创建、模型创建、模型训练、模型测试等等。面对众多的深度学习开发框架,...

机器人是如何与人对话的?其实原理很简单

机器人是如何与人对话的?其实原理很简单

最近在网上可以看到一个名叫索菲亚的机器人与人对话的视频,这个机器人的应答,除了表现得有点呆萌之外,已经非常接近人类。看来,以这样的节奏发展下去,与人类真假难辨的机器人出现的日子还真有可能在不久的将来实现。看到这个视频你可能心里会升起一个疑问,机器人是如何与人对话的?那么小编就按自己的理解,以我们平时...

关于对话机器人,你需要了解这些技术

关于对话机器人,你需要了解这些技术

对话系统(对话机器人)本质上是通过机器学习和人工智能等技术让机器理解人的语言。它包含了诸多学科方法的融合使用,是人工智能领域的一个技术集中演练营。图1给出了对话系统开发中涉及到的主要技术。对话系统技能进阶之路图1给出的诸多对话系统相关技术,从哪些渠道可以了解到呢?下面逐步给出说明。数学矩阵计算主要研...

元学习:实现通用人工智能的关键

元学习:实现通用人工智能的关键

本文转自:雷锋网本文作者FloodSung1前言MetaLearning(元学习)或者叫做LearningtoLearn(学会学习)已经成为继ReinforcementLearning(增强学习)之后又一个重要的研究分支(以后仅称为MetaLearning)。对于人工智能的理论研究,呈现出了Arti...

人工智能与隐私保护

人工智能与隐私保护

二十年前的1997年,深蓝多次击败顶级象棋大师,引发了全世界的巨大关注,人们对人工智能不断超越人类智慧的趋势既感到兴奋又感到担忧。人工智能在为人类社会作出巨大贡献的同时,会不会侵犯到人类的利益?这成了很多科学家、政治家和普通公众担忧的一件大事。​于是,科普大师和科幻泰斗艾萨克•阿西莫夫的机...

我国机器视觉发展现状及趋势是怎样的?

我国机器视觉发展现状及趋势是怎样的?

眼下,兼具精准高效特点的机器视觉正受到各国的一致关注与追捧,未来发展正展现出强大潜力,我国机器视觉发展现状、驱动因素和发展趋势究竟是怎样的呢?就和笔者一起来看看吧! 国内机器视觉发展究竟如何?三大问题让你秒懂!如今,随着图像处理、光学成像、传感器、处理器等技术的快速崛起与发展,机器视觉在人...

mahout实现的算列表

mahout实现的算列表

(一)Classification(分类算法)完全支持:1.LogisticRegression(Logistic回归)2.NaiveBayes/ComplementaryNaiveBayes(朴素贝叶斯/互补的朴素贝叶斯)3.RandomForests(随机森林)4.HiddenMarkovMod...

mahout算法库概要

mahout算法库概要

mahout算法库 分为三大块  1、聚类算法  2、协同过滤算法(一般用于推荐)      协同过滤算法也可以称为推荐算法!!!  3、分类算法         算法类   &n...

“元学习”的理解

“元学习”的理解

1、定义 元学习(MetaLearning)或者叫做“学会学习”(Learningtolearn),它是要“学会如何学习”,即利用以往的知识经验来指导新任务的学习,具有学会学习的能力。当前的深度学习大部分情况下只能从头开始训练。使用Finet...

opencv是什么

opencv是什么

OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库.      无论你是做科学研究,还是商业应用,opencv都可以作为你理想的工具库,因为,对于这两者,它完全是免费的。该库采用C及C++语言编写,可以在windows,linu...

AI芯片的过去和未来,看这篇文章就够了

AI芯片的过去和未来,看这篇文章就够了

相信你一定还记得击败了李世石和柯洁的谷歌“阿尔法狗”(AlphaGo),那你知道驱动AlphaGo的是什么吗?如果你觉得AlphaGo和人相似,只不过是把人脑换成了芯片,那么你就大错特错了。击败李世石的AlphaGo装有48个谷歌的AI芯片,而这48个芯片不是安装在Alpha...

StackingClassifier

StackingClassifier

写在前面scikit-learn官网的Ensemblemethods文档部分只介绍了/bagging/boosting/voting/三种模型组合方式;但是通过查找学习,受周志华《机器学习》集成学习部分的学习法启发,了解并学习了stacking,在此以作记录。概述Stacking是一种集合学习技术,...

集成学习总结&Stacking利器(mlxtend库)

集成学习总结&Stacking利器(mlxtend库)

mark一下,感谢作者分享!集成学习主要分为bagging,boosting和stacking方法。本文主要是介绍stacking方法及其应用。但是在总结之前还是先回顾一下继承学习。这部分主要转自知乎。1.Bagging方法: 给定一个大小为n的训练集D,Bagging算法从中均匀、有放回...