知乎/文章
2 分钟[ML 1分钟]第一版排序不上机器学习算法
一个新的产品需求来了,产品经理总会提前很久就来找机器学习的团队,讨论能不能在第一版上线中就加入“神奇的”机器学习排序算法。
“我也是想呢,但是不行“。

我们当然想着用机器学习去帮助每一个产品,但是在实践中,最早的版本不应该考虑机器学习算法。
原因
背后的原因有很多。
第一当然是数据。不管是有监督还是无监督算法,或多或少都需要一些用户行为的数据,产品上线了才能积累数据,才能理解用户的行为,才能试着用算法来排序。
第二,算法所涉及的系统往往相对复杂。新产品上线光能确保系统能正常运行就已经不容易了,能减少复杂的系统对于快速上线非常重要。
第三,也需要知道新产品的**影响力。**机器学习的研发投入资源可多可少,复杂的问题要有复杂的系统支撑,简单的问题调调包写个API也能解决。只有等第一版出了,看到了具体的影响力,才好决定到底要投入多少资源在这个产品之上。
简单的规则
早期的产品用一用最简单的规则排序就好:
- 人工排序往往质量很高。
- 稍微复杂一些使用简单的热度排序往往能解决60%的问题。很多时候机器学习模型打败简单的热度排序都很难。
- 用户的最近使用排在前面等等。
