机器学习相关术语

    xiaoxiao2021-03-26  29

    1.  超参数:机器学习模型中的框架参数,比如聚类算法中类的个数,K-邻接算法中K的值,距离的计算方法等。

    2.  过拟合:为了得到一致假设而使假设变得过度复杂称为过拟合。避免过拟合是分类器设计中的一个核心任务。

    3. 交叉验证:有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。比如将训练集分成5份,然后用其中4份作为训练集,另外1份作为验证集去调节超参数,然后再选择另外的4份作为训练集,剩余的1份作为测试集或验证集去调节超参数,最后把所有的得到的调节值取平均得到最终参数值。

    在实际情况下,人们不是很喜欢用交叉验证,主要是因为它会耗费较多的计算资源。一般直接把训练集按照50%-90%的比例分成训练集和验证集。但这也是根据具体情况来定的:如果超参数数量多,你可能就想用更大的验证集,而验证集的数量不够,那么最好还是用交叉验证吧。至于分成几份比较好,一般都是分成3、5和10份。

    转载请注明原文地址: https://ju.6miu.com/read-663017.html

    最新回复(0)