文章、回答、视频、播客和访谈的统一归档 · 全部内容 · 机器学习与数据科学 · 104 条 · 第 4 / 4 页
2014
2013
现在有音乐电台类网站使用基于音乐创作人及制作人的音乐推荐算法吗?它与主流算法相比有哪些优势和劣势?
常见的推荐算法有item-based 也有user-based(协同过滤)。 考虑到对于音乐本身feature的描述并不理想,所以通过计算音乐和音乐之间的相似性来进行推荐恐怕并不那么靠谱,无论是用音乐的歌手、“风格”、还是制作人。 使用协同过滤进行音乐推荐应该更佳。
为什么 Deep Learning 最先在语音识别和图像处理领域取得突破?
我觉得主要是因为搞Machine Learning的人大部分集中在这个领域
郑宇博士与他的Urban Computing
2013年8月,MIT Technology Review颁布了他们评比的35 Innovators under 35,也即35个35岁以下的创新者。毫无疑问,这些人的所在从事的研究或者项目,都是当前所热门的研究方向,是对于未来可能有重大影响的项目。在其中有一位,是微软亚洲研究院的郑宇博士,他所进行的研究方向,叫 Ur...
如何计算两份代码的相似度?
正好之前的毕设中阅读了相关的文献 这里依照我肤浅的理解也来回答一下 计算两份代码的相似度是有很多实际的应用背景的,比如在代码仓库中(Software Repository)中,大量的代码来自于相互的复制粘贴,如果能够合理地检测到相似的代码,将相似的代码只保存一份,那么可以减少大量的存储冗余,同时也可以更好地保证数据的一...
智能推荐、猜喜欢,这一类的功能有没有一种一般化的算法模型?
推荐算法最常见的是协同过滤和基于内容的推荐 一下内容来自互动百科: 推荐算法互动百科 推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法主要分为两种。 推荐算法互动百科推荐算法 - 基于内容的推荐基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是...
2012
如何在自己计算机上以图搜图?
。。。。。。。。。 想了想,没有想到有类似的软件,要不我给你讲讲如何自己写一个吧 几个关键的步骤: 1. 搜索本地所有图片 2. 为所有图片抽取特征,建立索引 3. 抽取所要查询图片的特征 4. 搜索 稍微详细一点的解释: 图片,太复杂了,所以我们的思路是把它转化为一个更简单的东西来搜索——向量。 我们只使用颜色特征。...
连续均匀分布的概率密度?
那是1,不是100% 你就想一个石头的密度如果是2 你会把它想成200%么。。。
如果把知乎迄今为止的所有问答作为研究资料,能得出什么有趣的结论?
科研有一个方向,就是研究问答社区的。一般叫 Community of Question-Answering 我们之前的科研就做过这个,用的是雅虎Answer的数据,因为其有API可以调用 你可以自己搜一下,这个方面的研究还是不少的
究竟豆瓣是机器驱动还是人工驱动?是算法控制还是人工控制?
通常来说我们正确的逻辑方式是 本质-表象 但是我们只能观测到表象,进而推测本质,这个中间,是会有问题的。 事实上,你的逻辑是: 数据(机器)驱动-排名不可能大幅变动 人工驱动-排名可能大幅变动 于是你从排名大幅变动中推测豆瓣是人工驱动的 但是!!()这个逻辑是有问题的,因为事实上 数据驱动-排名大幅变动 的可能性远远大...
2011
大数定律具体是个什么概念?
好吧,学概率的时候,我们总有一种潜在的潜在的观念 ——当数很大的时候平均值,就是期望值。 比如,我们投骰子,如果我们投100次,求出现的数的平均,我们觉得会差不多是(1+6)/2=3.5 因为我们按照期望计算,算出来就是3.5。 但是,这是我们一个假定,我们还需要论证,为什么当数很大的时候,平均值就是期望值呢? 啊,这...
有 64 张黑色牌和 64 张红色牌共 128 张,每摸到黑牌就可以继续摸下去,直到摸到红牌为止,红牌不算,请问平均能摸到几张黑牌?
http://www.zhihu.com/question/19821790 类似题目可参考 解:设摸到的黑牌有X张 概率: P(X=0)=64/128 P(X=1)=(64/128)(64/127) P(X=2)=(64/128)(63/127)(64/126) …… P(X=i)=(64/128)……((64-i+...