本内容按照吴恩达公开课《Machine Learning》的 Lecture Slides 进行分类,每一个H1标题对应一个Lecture Slide,每一个H2标题对应Lecture Slide中的一个小章节。

本内容是课程的简化总结,适合已经了解机器学习基本概念的人进行回顾以及查漏补缺。

# 1 机器学习简介

# 1.1 什么是机器学习

Arthur Samuel (1959) 总结:机器学习是研究不通过明确编程赋予计算机学习能力的领域

Tom Mitchell (1998) 定义了机器学习问题:如果一段计算机程序在某个任务T上的表现P通过经验E发生了提升,那么就可以认为这段程序学习到了这个任务T上的经验E

编者注1:后来我们就知道任务T就是学习目标表现P就是损失函数/评价指标经验E就是训练数据

编者注2:为什么评价指标不能用来当作损失函数?因为一个指标要用作损失函数必须在数学上可以进行优化,不可进行优化的指标只能拿来当评价。

本课程将会讲:

  • 监督学习
  • 非监督学习
  • 强化学习,推荐系统等
  • 实操学习算法过程中的建议

# 1.2 监督学习

讲了两个监督学习的例子:

  • 回归:房价预测(连续)
  • 分类:肿瘤恶性良性区分(非连续)

# 1.3 非监督学习

讲了一些案例:

  • 从大量Google新闻中提取出某个相同主题的新闻

  • 从不同基因的人中找出具有类似基因的人

  • 服务器集群管理,社交网络分析(社群发现),市场用户划分,天文数据分析