文章插图
十折交叉验证十折交叉验证,英文名叫做10-fold cross-validation,用来测试算法準确性 。是常用的测试方法 。将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验 。
【十折交叉验证】每次试验都会得出相应的正确率(或差错率) 。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法準确性的估计 。
基本介绍中文名:十折交叉验证
外文名:10-fold cross-validation
作用:测试算法準确性
十折交叉验证之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点 。但这并非最终诊断,争议仍然存在 。而且似乎5折或者20折与10折所得出的结果也相差无几 。