返回

陈然的公开内容

文章、回答、视频、播客和访谈的统一归档 · 全部内容 · 机器学习与数据科学 · 104 条 · 第 3 / 4

2016

有哪些比较好的机器学习、数据挖掘、计算机视觉的订阅号、微博或者是论坛?

知乎/回答
1 分钟

谢邀 Data science blogs: GitHub - rushter/data-science-blogs: A curated list of data science blogs 是一个比较长的数据科学、机器学习等内容的博客列表,给了rss,会不断增加。

机器学习与数据科学求学、留学与学习

如何看待人工智能律师的诞生,类似Ross的人工智能律师在中国是否可行?

知乎/回答
2 分钟

谢邀 我在CMU硕士毕业的时候的毕业设计,做的是AI&Law相关的研究,之前也写过一点内容: AI and Law, 人工智能与法律(一):欢迎围观 - Hello 陈然! - 知乎专栏 希望大家看看,督促我继续写下去。 总体上我是认同 @梅林 的答案的,由于现在技术的局限性,我们关注的更多的是如何使用技术帮助律师(或...

AI 与未来机器学习与数据科学

如何看待 Pinterest 的相似视觉搜索结果?

知乎/回答
1 分钟

从技术难度来讲,受益于深度学习的发展,相似图片搜索几乎已经成为一个解决的问题。 在应用的领域,Pinterest 带了一个好头,是一个非常优秀的应用典范。同时,发布的论文 http://www.kevinjing.com/visualsearchatpinterest.pdf 从系统架构来讲,也非常有指导性。 从工程角...

机器学习与数据科学构建与工程

Zillow 数据集怎么下载?

知乎/回答
1 分钟

谢邀 Zillow 是全球最大房地产数据平台。大部分的房地产有关数据都已经分门别类整理好,并按照省份、城市、社区等各个粒度提供下载: Data - Zillow Research 同时,受益于美国所有房屋数据Public Records对所有人都开放,以及成熟的MLS系统,从第三方比如 Retsly 也可以通过API等...

机器学习与数据科学海外生活实务

2015

CMU硕士还有半年毕业,找工作想专注找到真正热爱的data scientist工作但又怕太冒险怎么办?

知乎/回答
2 分钟

谢邀 如果就是为了Data Scientist这个 Title的话,我觉得没有必要担心,现在很多公司也都知道求职者非常喜欢Title,所以也给了很多这个Title的职位的,所以只要你继续努力找,一定会找到一份叫Title叫做Data Scientist的工作。 如果所爱的并不是Title,而是实际工作内容的话,那么就需...

职业成长与心态机器学习与数据科学

Docker 的应用场景在哪里?

知乎/回答
1 分钟

Docker for Data Science at Trulia 和一点感悟 - Hello陈然! - 知乎专栏 我们在Trulia Data Science Team 里面推行了Docker。一方面是搭建API做SOA,另一方面也在帮助每一个Data Scientist 都可以直接从最开始算法分析、开发一直做到部署...

构建与工程机器学习与数据科学

Docker for Data Science at Trulia 和一点感悟

知乎/文章
4 分钟

刚刚在 Trulia 的博客上发表了我的第一篇文章:Docker for Data Science at Trulia. -How Trulia’s Data Scientists Minimized Releasing, Testing, and DevOps Efforts with Docker 文章大意,就是我...

构建与工程机器学习与数据科学

抛弃幻想,谈谈现实中的数据科学家

知乎/文章
7 分钟

Data Scientist,数据科学家,太火了,已经成为新一代改变世界的职业,引得每一个人都想往这个方向转。 学CS的觉得做码农太底层,给人打工,要转数据科学家,完美。 学统计的觉得这个不需要过多的 Coding,适合自己,要转数据科学家,完美。 学商科的觉得终于自己也可以成为科学家了,要转数据科学家,完美。 似乎每...

机器学习与数据科学职业成长与心态

data scientist 有什么常见 machine learning 相关的面试问题?

知乎/回答
2 分钟

谢邀 适合面试ML的题目可借鉴性并不大,因为很多时候你懂了就是懂了,不懂就是不懂,刷题并没有很大的帮助。努力啃课本,看论文,看公开课,才是王道。 要说题目哪里多的话,其实可以参考各大经典教材的习题,比如PRML的课后习题。 另一方面,我在我之前面试的过程中也被问了不少ML的题目,原文可参考: Data Scientis...

机器学习与数据科学

申请卡耐基梅隆Machine Learning硕士难度有多大?

知乎/回答
1 分钟

谢邀 听说申请难度非常大,不知道是不是CMU 申请难度最大的硕士项目,毕竟招的人太少。 建议自己看现在的学生列表: Masters Students-Machine Learning Department 注:其中不少人是CMU的PhD辅修MLD的Master,注意分辨。 感觉没有在顶会发过若干一作还是很难的。

求学、留学与学习机器学习与数据科学

该不该坚持学习Machine Learning?

知乎/回答
2 分钟

谢邀 一个技能学与不学,肯定有千万种理由,然而并没有一种理由叫做‘因为赶不上最牛的人,所以不学了’。如果你真有这样的观点,为何要继续‘老老实实做开发’呢?别人做开发了几十年了,你赶的的上最牛的人吗?为何要‘多看看系统设计类的东西’呢?别人系统设计也做了几十年了,你赶得上最牛的人吗?既然什么东西都赶不上最牛的人,还继续学...

职业成长与心态机器学习与数据科学

机器学习会变成大学本科专业吗?

知乎/回答
1 分钟

谢邀 短期来看并不会成为大学专业 但是已经成为了不少硕士项目的方向 长期来看 大学可能不会再有专业一说 毕竟高等教育并没有义务保证你能成为什么样的人 成为什么样的人是自己的选择 换句话说 上什么课 找什么工作 都是自己对自己的负责 学校理论上只需要为学生提供最好的服务 最多高质量的课程 让学生能得到他想得到的东西就好 ...

求学、留学与学习机器学习与数据科学

Kaggle 的比赛在 Machine Learning 领域中属于什么地位?

知乎/回答
1 分钟

在主流科研界可能影响已经不大了,但是在工业界中依然很受用。如果你有一些特别亮点的成绩,还是很有说服力的。也正如 @lau phunter 中提到的答案一样。 如果要在Kaggle比赛里面获得一个好的成绩,免不了要做大量的实验:关于参数选择,模型选择,以及特征工程等等。而为了高效地完成这些实验,即要有良好的实验思想,又要...

机器学习与数据科学

CVPR 2015 有什么值得关注的亮点?

知乎/回答
3 分钟

本人并非CV专业科研人员,只是最近在Trulia ( Trulia: Real Estate Listings, Homes For Sale, Housing Data )做和图像相关的科研项目,所以老大一挥手就把我和同事按排到Boston来围观CVPR了……总体上除了食物非常差,订不到旅馆以外,其他的收获都非常大。...

机器学习与数据科学社会与科技观察

AI and Law, 人工智能与法律(一):欢迎围观

知乎/文章
5 分钟

有人曾经提过这么一个问题:法律是否可能被代码化? - 计算机 引发了不少的讨论。从开始时的戾气颇重的清一色的“当然不行”类回答,到慢慢的终于出现了“有的行,有的不行”的更为客观的回答。虽然有不少真知灼见,然而并没有看到有资深的专家出来,做出更详尽的回答。 这其实是一个非常好的问题,这背后是一股无法阻挡的新算法、新模型、...

机器学习与数据科学AI 与未来

Data Scientist 面试都面了哪些题?

知乎/文章
3 分钟

在之前的文章 CMU-CS硕士北美码农求职小记:Data Scientist 中,我简略叙述了我求职的经历,这里我也记录一下我面试过哪些类型的题目。面试的职位包括:Data Scientist,Data Engineer,Software Engineer in Machine Learning,Data Analys...

机器学习与数据科学求学、留学与学习

参加MLSS (Machine Learning Summer School) 是怎样的体验?

知乎/回答
1 分钟

谢邀 我并没有完整地参加过MLSS,但是去围观了2014暑假在CMU的MLSS。 都是偷偷混进去的,听了几个讲座,拿了一件衣服…… 讲的人都是比较牛的,Topic也是比较热门的,当然,感觉并不是给初学者听的,再加上各路大神的英语口音也非常丰富,估计很多人都是听得一头雾水…… Anyway,这个答案并没有什么实际内容……...

求学、留学与学习机器学习与数据科学

2014

有哪些算法惊艳到了你?

知乎/回答
2 分钟

Reservoir Sampling( Reservoir sampling ) 这是我在今年求职过程中面试的时候被问到的,因为之前很少接触Streaming的算法,在听到这个题目的时候被惊呆了,根本不能理解: 给一个Streaming的Data,未知长度,要求在Streaming结束后返回N个Data,且是等概率的。...

构建与工程机器学习与数据科学

CMU-CS 硕士北美码农求职小记:Data Scientist

知乎/文章
8 分钟

拒了另一个 Offer,工作彻底也定了,考虑到还有同学正在找工作,先简单地写一点东西,希望对正在北美找工作的同学有帮助。也请关注我的知乎专栏,我会写一些关于我在 CMU 的经历,我的在实验室干活的感受,以及找工作酸甜苦辣。 一点背景介绍,陈然,THU 软件学院2009级,CMU-MCDS 13Fall,暑假在 MCDS...

机器学习与数据科学职业成长与心态求学、留学与学习

如何在知乎中准确高效地邀请知友回答问题?

知乎/回答
1 分钟

其实这是一个经典的Community Question Answering Expertise Identification 的问题,已经有很多现成的Machine Learning的算法,而不是仅仅基于关键词匹配的算法,来帮助改善问题。 希望知乎在开发有余力的时候可以开始考虑优化这些算法。而不是寄托于希望用户知道该邀...

机器学习与数据科学随笔与杂谈

机器学习有很多关于核函数的说法,核函数的定义和作用是什么?

知乎/回答
1 分钟

谢邀 详细的公式什么的,网络上搜索kernel function, kernel methods 有很多,我就不仔细说了,简单地说说背后的intuition。 intuition也很简单,比如我们有一个一维的数据分布是如下图的样子,你想把它用一个直线来分开,你发现是不可能的,因为他们是间隔的。所以不论你画在哪,比如绿色...

机器学习与数据科学

计算机科学领域中,论文灌水现象严重吗?

知乎/回答
1 分钟

中文论文中不少基本没有原创性 可能连灌水都算不上 国际的很多二流三流会议也充斥着灌水论文 顶尖的会议虽然好一点 但是这几年随着data mining相关领域的崛起 尤其是social network方向 基本没有统一的研究问题 没有统一的数据集 少有相互比较的模型 又加上PGM和MCMC等技术的成熟为建模和计算带来了极...

求学、留学与学习机器学习与数据科学

高考分数线可不可以通过一些神经网络算法预测得出一个可信的范围?

知乎/回答
1 分钟

Machine Learning大多数时候不解决是否可信的问题 只关注在测试集上的误差 所以能否预测一个可信的范围?不知道 但是可以通过模型训练出一个在现有数据集上误差不大的模型 这又怎么样呢?本质上跟自己估算也没有区别

机器学习与数据科学求学、留学与学习

如何成为数据科学家?

知乎/回答
2 分钟

抛弃幻想,谈谈现实中的数据科学家 - Hello陈然! - 知乎专栏 大部分心中的Data Scientist 可能是上文中的Type A Data Scientist。 但是从我的接触来看,现在更大的需求来自于Type B Data Scientist,也即大家都是知道现在基于机器学习的算法能够帮助企业增长是大趋势,...

机器学习与数据科学职业成长与心态

从现实角度出发,股票价格被假设为服从马尔科夫过程(Markov Process)是否合理?

知乎/回答
1 分钟

题主的困惑其实很简单唉,为何大家都这么能说。 隐式马尔科夫模型是假定当前t时刻的状态只和t-1时刻的状态有关,与t-2和再往前的状态无关。而题主最困惑的地方,是这里所谓的“状态”,并不一定是1秒或者1天的股票价格,还可以是1年的,10年的,全看你自己怎么定义。所以当然参考过去1年或者10年的股价都是符合这个模型的。 至...

机器学习与数据科学

数学专业转机器学习,需要哪些计算机和编程方面的积累?

知乎/回答
1 分钟

The Open Source Data Science Masters by datasciencemasters 对照相关课程查缺补漏?

求学、留学与学习机器学习与数据科学

机器学习,数据挖掘在研究生阶段大概要学些什么?

知乎/回答
1 分钟

The Open Source Data Science Masters by datasciencemasters 看到一个不错的网站,是一个Stanford的CS学生维护的,上面列出了这个方向相关的课程和相应的资源,我觉得很不错。

求学、留学与学习机器学习与数据科学

物理专业自学计算机应该学些什么?

知乎/回答
2 分钟

每个人站的角度不同,现在的答案基本都是从图形学的角度建议,我换个角度。 从研究生计算机科学做研究的角度来讲,我认为本科最适合的专业首先是物理,其次是数学,再次才是计算机。数学学的太抽象,抽象层次太高,研究现实问题的人往往处在鄙视链的底端。计算机学的太底层,对于概率论、随机过程、线性代数等学科学的太少,不了解建模分析的那...

求学、留学与学习机器学习与数据科学

微软有哪些语音识别技术积累,Cortana 能否跟 Siri 和 Google Now 抗衡?

知乎/回答
1 分钟

语音识别做的再好也快到瓶颈了。 难得还是在语义识别,以及和具体业务的结合,这一点上Siri和Google Now也都没有什么惊喜。

机器学习与数据科学社会与科技观察

概率图模型(PGM)有必要系统地学习一下吗?

知乎/回答
1 分钟

PGM 有必要系统地学习 PGM 的原理经过若干大牛的归纳后已经并不那么复杂,看看怎么建模,怎么 Learn,怎么 Inference,就能掌握原理的精髓。但是,PGM 可以把这几年机器学习的主流发展方向串起来,会讲很多正在流行的模型,这为这门不是那么系统的学科搭了一个框架,又讲可以讲理论,又可以讲在图像、语音的应用,...

机器学习与数据科学求学、留学与学习