学习:acquiring skill with experience accumulated from abservations 从观察积累的知识出发学习技能
观察 —> Learning —-> skill
机器学习:aquiring skill with experience accumulated/computed from data;
data —-> ML ——> skill
Skill : improve some performance measure ( e.g. prediction accuracy)
data —-> ML —–> improved performance measure
- 存在需要被学习的模式
- 但是没有可以很容易的对模式定义的数学描述
- 并且存在关于该模式的大量数据
- food:从社交网络上挖掘文本和位置信息,学习餐厅的卫生状况对健康的影响
- Clothing: 用销售数据和客户调查数据来给客户进行穿衣搭配的推荐
- Housing: 从建筑特征和能耗负载数据来预测建筑的能耗
- 行:自动驾驶
- 机器学习:用数据去算出一个和目标函数很接近的假设函数
- 数据挖掘:用大量数据去找到数据里面有用有趣的性质,关联等
- 如果把数据挖掘的目标限制为找到一个和目标函数很接近的假设函数的话,那么机器学习和数据挖掘没什么本质的不同,他们目标是一致的。
- 但是数据挖掘的目标并不总是这样,如果interesting property和’hypothesis that approximate target是相关的,那么 数据挖掘 可以帮助机器学习,并且反过来也一样(vice versa)
- 传统的数据挖掘同样也关注在大数据库里实现高效的计算
- 他们非常相像,但是不完全相同
- Statistics : use data to make inference about an unknown process
- g is an inference outcome; f is something unknown ; statistics can be used to achieve ML
- 传统的统计学同样也专注于证明数学假设,但是不关心如何计算
- 机器学习用到的许多工具很早就在统计学里面出现了,所以统计学为机器学习提供了有力的工具
- input: x$\in$X
- output: y $\in$ Y
- unknown pattern to be learned $\Leftarrow\Rightarrow$ target function: f: X$\rightarrow$Y
- data $\Leftarrow\Rightarrow$ training examples
- hypothesis $\Leftarrow\Rightarrow$ skill with hopefully good performance: g: X $\rightarrow$ Y

