Machine Learning by Andrew Ng 学习笔记(1)
[TOC]
Machine Learning by Andrew NG from Stanford
最近开始学习机器学习,从standford的Andrew Ng讲授的入门课程开始。
教师的简介:
吴恩达1976年出生于伦敦,他的英文名叫Andrew Ng,吴恩达年轻时候在香港和新加坡度过。1992年吴恩达就读新加坡莱佛士书院,并于1997年获得了卡内基梅隆大学的计算机科学学士学位。之后他在1998年获得了麻省理工学院的硕士学位,并于2002年获得了加州大学伯克利分校的博士学位,并从这年开始在斯坦福大学工作。他(2002年)住在加利福尼亚州的帕洛阿尔托。
吴恩达是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达主要成就在机器学习和人工智能领域,他是人工智能和机器学习领域最权威的学者之一。
2010年,时任斯坦福大学教授的吴恩达加入谷歌开发团队XLab——这个团队已先后为谷歌开发无人驾驶汽车和谷歌眼镜两个知名项目。
吴恩达与谷歌顶级工程师开始合作建立全球最大的“神经网络”,这个神经网络能以与人类大脑学习新事物相同的方式来学习现实生活。谷歌将这个项目命名为“谷歌大脑”。
吴恩达最知名的是,所开发的人工神经网络通过观看一周YouTube视频,自主学会识别哪些是关于猫的视频。这个案例为人工智能领域翻开崭新一页。吴恩达表示,未来将会在谷歌无人驾驶汽车上使用该项技术,来识别车前面的动物或者小孩,从而及时躲避。
2014年5月16日,百度宣布吴恩达加入百度,担任百度公司首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。
2014年5月19日,百度宣布任命吴恩达博士为百度首席科学家,全面负责百度研究院。这是中国互联网公司迄今为止引进的最重量级人物。消息一经公布,就成为国际科技界的关注话题。美国权威杂志《麻省理工科技评论》(MIT Technology Review)甚至用充满激情的笔调对未来给予展望:“百度将领导一个创新的软件技术时代,更加了解世界。”
这门课通俗易懂,很适合入门。
课程地址戳这里
机器学习的定义
- Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
机器学习的发展历史
机器学习是人工智能研究较为年轻的分支,它的发展过程大体上可分为4个时期。
- 第一阶段是在20世纪50年代中叶到60年代中叶,属于热烈时期。
- 第二阶段是在20世纪60年代中叶至70年代中叶,被称为机器学习的冷静时期。
- 第三阶段是从20世纪70年代中叶至80年代中叶,称为复兴时期。
- 机器学习的最新阶段始于1986年。
机器学习进入新阶段的重要表现在下列诸方面:
1) 机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。
2) 结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。
3) 机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。
4) 各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。
5) 与机器学习有关的学术活动空前活跃。国际上除每年一次的机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。
#机器学习主要方法
- supervised learning (监督学习)
特点: 正确的答案已经给机器了,机器知道什么是正确的(right answer given)
目标:学习从输入x到输出y的映射。方法是:给定某个依赖于一组参数的模型:
$$ y = g(x|theta) $$
其中g(.)是模型,theta是模型的参数。对于回归 y 是数值,对于分类,y 是类编码. 机器学习优化参数theta,使得逼近误差最小,也就是说,我们的估计要尽可能的接近训练集中给定的正确值(最小二乘法等).
监督学习主要有两类:
* 1. regression(回归)
用于 prediction 预测 , 输出的是连续(continuous)的值
* 2. classification(分类)
用于 classify 分类, 输出的是离散的(discrete)值
unsupervised learning(非监督学习)
特点:没有给定right answer,机器得靠自己去推断。
目标:发现输入数据中的规律。输入空间存在某种结构,使得特定的模式比其他模式更常出现,而我们希望知道那些经常发生,那些不常发生。在统计学中,这成为density estimation 密度估计, 密度估计的一种方法是聚类(clusturing),其目标是发现输入数据的簇或分组。
reinforcement learning(增强学习)
Reinforcement learning is an area of machine learning inspired by behaviorist psychology, concerned with how software agents ought to take actions in an environment so as to maximize some notion of cumulative reward. The problem, due to its generality, is studied in many other disciplines, such as game theory, control theory, operations research, information theory, simulation-based optimization, statistics, and genetic algorithms. In the operations research and control literature, the field where reinforcement learning methods are studied is called approximate dynamic programming. The problem has been studied in the theory of optimal control, though most studies there are concerned with existence of optimal solutions and their characterization, and not with the learning or approximation aspects. In economics and game theory, reinforcement learning may be used to explain how equilibrium may arise under bounded rationality.