文章、回答、视频、播客和访谈的统一归档 · 全部内容 · 机器学习与数据科学 · 2014 · 16 条 · 第 1 / 1 页
2014
有哪些算法惊艳到了你?
Reservoir Sampling( Reservoir sampling ) 这是我在今年求职过程中面试的时候被问到的,因为之前很少接触Streaming的算法,在听到这个题目的时候被惊呆了,根本不能理解: 给一个Streaming的Data,未知长度,要求在Streaming结束后返回N个Data,且是等概率的。...
CMU-CS 硕士北美码农求职小记:Data Scientist
拒了另一个 Offer,工作彻底也定了,考虑到还有同学正在找工作,先简单地写一点东西,希望对正在北美找工作的同学有帮助。也请关注我的知乎专栏,我会写一些关于我在 CMU 的经历,我的在实验室干活的感受,以及找工作酸甜苦辣。 一点背景介绍,陈然,THU 软件学院2009级,CMU-MCDS 13Fall,暑假在 MCDS...
如何在知乎中准确高效地邀请知友回答问题?
其实这是一个经典的Community Question Answering Expertise Identification 的问题,已经有很多现成的Machine Learning的算法,而不是仅仅基于关键词匹配的算法,来帮助改善问题。 希望知乎在开发有余力的时候可以开始考虑优化这些算法。而不是寄托于希望用户知道该邀...
机器学习有很多关于核函数的说法,核函数的定义和作用是什么?
谢邀 详细的公式什么的,网络上搜索kernel function, kernel methods 有很多,我就不仔细说了,简单地说说背后的intuition。 intuition也很简单,比如我们有一个一维的数据分布是如下图的样子,你想把它用一个直线来分开,你发现是不可能的,因为他们是间隔的。所以不论你画在哪,比如绿色...
计算机科学领域中,论文灌水现象严重吗?
中文论文中不少基本没有原创性 可能连灌水都算不上 国际的很多二流三流会议也充斥着灌水论文 顶尖的会议虽然好一点 但是这几年随着data mining相关领域的崛起 尤其是social network方向 基本没有统一的研究问题 没有统一的数据集 少有相互比较的模型 又加上PGM和MCMC等技术的成熟为建模和计算带来了极...
高考分数线可不可以通过一些神经网络算法预测得出一个可信的范围?
Machine Learning大多数时候不解决是否可信的问题 只关注在测试集上的误差 所以能否预测一个可信的范围?不知道 但是可以通过模型训练出一个在现有数据集上误差不大的模型 这又怎么样呢?本质上跟自己估算也没有区别
如何成为数据科学家?
抛弃幻想,谈谈现实中的数据科学家 - Hello陈然! - 知乎专栏 大部分心中的Data Scientist 可能是上文中的Type A Data Scientist。 但是从我的接触来看,现在更大的需求来自于Type B Data Scientist,也即大家都是知道现在基于机器学习的算法能够帮助企业增长是大趋势,...
从现实角度出发,股票价格被假设为服从马尔科夫过程(Markov Process)是否合理?
题主的困惑其实很简单唉,为何大家都这么能说。 隐式马尔科夫模型是假定当前t时刻的状态只和t-1时刻的状态有关,与t-2和再往前的状态无关。而题主最困惑的地方,是这里所谓的“状态”,并不一定是1秒或者1天的股票价格,还可以是1年的,10年的,全看你自己怎么定义。所以当然参考过去1年或者10年的股价都是符合这个模型的。 至...
数学专业转机器学习,需要哪些计算机和编程方面的积累?
The Open Source Data Science Masters by datasciencemasters 对照相关课程查缺补漏?
机器学习,数据挖掘在研究生阶段大概要学些什么?
The Open Source Data Science Masters by datasciencemasters 看到一个不错的网站,是一个Stanford的CS学生维护的,上面列出了这个方向相关的课程和相应的资源,我觉得很不错。
物理专业自学计算机应该学些什么?
每个人站的角度不同,现在的答案基本都是从图形学的角度建议,我换个角度。 从研究生计算机科学做研究的角度来讲,我认为本科最适合的专业首先是物理,其次是数学,再次才是计算机。数学学的太抽象,抽象层次太高,研究现实问题的人往往处在鄙视链的底端。计算机学的太底层,对于概率论、随机过程、线性代数等学科学的太少,不了解建模分析的那...
微软有哪些语音识别技术积累,Cortana 能否跟 Siri 和 Google Now 抗衡?
语音识别做的再好也快到瓶颈了。 难得还是在语义识别,以及和具体业务的结合,这一点上Siri和Google Now也都没有什么惊喜。
概率图模型(PGM)有必要系统地学习一下吗?
PGM 有必要系统地学习 PGM 的原理经过若干大牛的归纳后已经并不那么复杂,看看怎么建模,怎么 Learn,怎么 Inference,就能掌握原理的精髓。但是,PGM 可以把这几年机器学习的主流发展方向串起来,会讲很多正在流行的模型,这为这门不是那么系统的学科搭了一个框架,又讲可以讲理论,又可以讲在图像、语音的应用,...
大二本科生,怎样入门机器学习和算法?
去Cousera上把Stanford的Machine Learing课上了 把概率统计和高等代数再学几遍 就差不多入门了
北京哪几所高校有数据分析或数据挖掘方向的研究生专业?
Jie Tang (Tang, Jie) 's Homepage 清华唐杰老师
以后想从事大数据方面的工作,大学专业应该怎么报?
计算机科学与技术