知乎/回答
1 分钟

如何看待深度学习中不分验证集?

作者

创建于

修改于

发布于知乎/回答

这就是典型的 overfitting 嘛,自欺欺人地刷数据。有限数据,天赋异禀,看着训练集,靠着随机函数丢硬币丢出完美符合的测试集的 if-else,拿到完美指标。刷就是了。

不过这是所有公开数据集都难以避免的,毕竟所有的数据都开放了,只要数据有限,不管怎么分,总有可能过拟合。所以刷数据的论文主要是看个 insight,有没有用还是要去真实数据集线上验证。

现在不少比赛都做的不错,只开放部分数据让大家提交自己觉得最好的模型,最后在非公开的数据上验证结果。这样比赛出来的结果往往模型都是经得起考验的。不过基本都是多个模型 ensemble,看的也头疼。

怎么看,别看了,大家都知道这不对,但也没有别的更好的办法。