[ML 1分钟]第一版排序不上机器学习算法

机器学习与数据科学构建与工程2 分钟

陈然

2021年9月28日修改于 2021年9月29日

知乎/文章

和 AI 讨论这篇文章

ChatGPT

Claude

一个新的产品需求来了，产品经理总会提前很久就来找机器学习的团队，讨论能不能在第一版上线中就加入“神奇的”机器学习排序算法。

“我也是想呢，但是不行“。

我们当然想着用机器学习去帮助每一个产品，但是在实践中，最早的版本不应该考虑机器学习算法。

原因

背后的原因有很多。

第一当然是数据。不管是有监督还是无监督算法，或多或少都需要一些用户行为的数据，产品上线了才能积累数据，才能理解用户的行为，才能试着用算法来排序。

第二，算法所涉及的系统往往相对复杂。新产品上线光能确保系统能正常运行就已经不容易了，能减少复杂的系统对于快速上线非常重要。

第三，也需要知道新产品的影响力。机器学习的研发投入资源可多可少，复杂的问题要有复杂的系统支撑，简单的问题调调包写个API也能解决。只有等第一版出了，看到了具体的影响力，才好决定到底要投入多少资源在这个产品之上。

简单的规则

早期的产品用一用最简单的规则排序就好：

人工排序往往质量很高。
稍微复杂一些使用简单的热度排序往往能解决60%的问题。很多时候机器学习模型打败简单的热度排序都很难。
用户的最近使用排在前面等等。

总之，上线第一，越轻越好，算法很大，嵌入需要合适的时机。

继续阅读

全部内容

知乎/文章2025年2月5日4 分钟

大模型落地的未来：开源+微调？

最近，AI 社区里流传着这样一句话——“通用大模型很强，但我并不需要我的应用去给我背诵法文诗歌。” 这句话听上去有点调侃，却反映了一个重要现象：许多企业和开发者在早期会选择大型通用模型（例如 GPT-4）去快速验证想法，但真正想要落地到生产环境，往往发现必须在速度、成本和“专用领域准确度”之间做权衡。于是，“微调（F...

知乎/文章2021年10月9日3 分钟

[ML 1分钟]细节太多，犯错太容易

机器学习工程师小月最近一直在研究新的深度学习算法。相对于现有的算法框架，新算法要求兄弟团队一块搭建了不少新的框架，也选用了一些以前不太熟悉的库。经过了三个月的准备，终于可以上线AB测试了。但是AB测试效果老是不好经过了几个月的迭代，效果依然不佳，仅仅只比手动排序更好，与现有的模型相比效果差距甚远。离线数据 AUC，...

知乎/文章2021年10月1日2 分钟

[ML 1分钟]第一个模型能跑通就不错了

有业务能上机器学习模型了，算法工程师小月开心地不行。毕竟作为一名机器学习工程师，口袋子藏着无数陈年老模型：线性模型、树模型、深度模型、增强学习，要啥有啥。业务一来，恨不得立刻就掏出最炫酷的模型，一步到位。但是，第一个模型，一定要简单正当小月兴奋着呢，经理大圆泼了一瓢冷水，“第一个模型，一定要简单”。第一个次迭代往...