知乎/回答
1 分钟Kaggle 的比赛在 Machine Learning 领域中属于什么地位?
在主流科研界可能影响已经不大了,但是在工业界中依然很受用。如果你有一些特别亮点的成绩,还是很有说服力的。也正如
@lau phunter 中提到的答案一样。
如果要在Kaggle比赛里面获得一个好的成绩,免不了要做大量的实验:关于参数选择,模型选择,以及特征工程等等。而为了高效地完成这些实验,即要有良好的实验思想,又要有扎实的代码功底来完成Pipeline设计与架构。这都非常考验人的综合能力,是工业界需要的人才。
当然即便如此,Kaggle的比赛已经比真实世界中的机器学习要做的事情简化太多了。我们平时时间都花在哪了?
-
确定要解决的问题到底是什么
-
明确优化指标
-
收集合适的数据
-
数据清洗
-
做各种实验
-
要求其他组的人协同做A/B Test
-
把机器学习的Pipeline整合到其他产品的Pipeline中
-
在各个场合推销我们的模型真的有用……
所以真正能跑实验的时间并不多。但无论怎样,至少Kaggle中取得一个好成绩说明你真的可以系统性地做实验,是非常大的亮点,也是非常过硬得指标。
