机器学习-1.机器学习的基本概念
什么是机器学习?我不是科班出身所以就不乱喷了,借用百度百科的机器学习的概念介绍。机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 其他机器学习中的一些概念: 1.训练集(training set/data/example) 训练集是用来进行训练而产生模型或算法的数据集 2.测试集(testing set/data/example) 用来测试已经学习好的模型或算法的数据集 3.特征向量(features vector) 属性的集合通常用一个向量来表示,特征向量是附属于一个实例的 4.标记(class label) 实例类别或属性的标记 5.正例、反例 6.分类(classfication) 目标标记结果为类别数据 7.回归(regression) 目标标记结果为连续性数值数据 8.监督学习(supervised learning)、无监督学习(unsupervised learning)、半监督学习(semi-supervised learning) 在训练集中有人工标记的为supervised learning,反之为unsupervised learning,两者结合为semi-supervised learning 接下来我们来看一个例子。