知道了输入的数据以及每条数据对应的输出,我们根据训练集中的输入与输出数据构造出一个映射函数,然后可以给预测新的输入数据的输出。比如分类算法。
只知道输入数据而没有任何对应输出,通过挖掘数据内在特征对数据进行建模与整理。比如聚类算法。
介于监督学习与非监督学习之间,根据有类标的数据与无类标签的数据一起学习出分类模型,然后给新来的输入数据进行划分。
有时候有类标的数据比较少,但是人工去标记其他无标签数据的代价太大。主动学习研究的是如何挑选出合适的数据让人工去标记,让筛选出的数据尽量小且最终的结果尽量好。
直推学习是半监督学习的一个子问题,直推学习假设数据中那些没有标签的数据就是最终要使用到的数据,也就是要对训练数据中的无标签数据进行分类。半监督学习只根据有标签和无标签的数据训练出模型,并不关心数据中无标签数据可能属于的类。