本内容按照吴恩达公开课《Machine Learning》的 Lecture Slides 进行分类,每一个H1标题对应一个Lecture Slide,每一个H2标题对应Lecture Slide中的一个小章节。
本内容是课程的简化总结,适合已经了解机器学习基本概念的人进行回顾以及查漏补缺。
# 1 机器学习简介
# 1.1 什么是机器学习
Arthur Samuel (1959) 总结:机器学习是研究不通过明确编程赋予计算机学习能力的领域
Tom Mitchell (1998) 定义了机器学习问题:如果一段计算机程序在某个任务T上的表现P通过经验E发生了提升,那么就可以认为这段程序学习到了这个任务T上的经验E。
编者注1:后来我们就知道任务T就是学习目标,表现P就是损失函数/评价指标,经验E就是训练数据。
编者注2:为什么评价指标不能用来当作损失函数?因为一个指标要用作损失函数必须在数学上可以进行优化,不可进行优化的指标只能拿来当评价。
本课程将会讲:
- 监督学习
- 非监督学习
- 强化学习,推荐系统等
- 实操学习算法过程中的建议
# 1.2 监督学习
讲了两个监督学习的例子:
- 回归:房价预测(连续)
- 分类:肿瘤恶性良性区分(非连续)
# 1.3 非监督学习
讲了一些案例:
从大量Google新闻中提取出某个相同主题的新闻
从不同基因的人中找出具有类似基因的人
服务器集群管理,社交网络分析(社群发现),市场用户划分,天文数据分析