文章、回答、视频、播客和访谈的统一归档 · 知乎 · 机器学习与数据科学 · 98 条 · 第 2 / 4 页
2017
2017 小感
作为2011年就加入知乎的早期用户红利获得者,这两年感觉自己输出能力弱了很多。学生时代的大部分所思所感都表达过了,而工作后,面对大千世界,很多东西自己也没有想清楚,很难向大家分享有意义的思考,也就作罢。埋头学习,认真思考,少说多做,等到时机到了,自然会有文思泉涌的时候,不必强求。 但2017年还是非常精彩的一年,在这里...
如何评价 Uber Head of Finance 加入 Opendoor?这是家什么样的公司?
来给 Opendoor 大佬 @Rorschach 站台,我来讲讲这个行业从业者的感受。 2015年2月,我从 CMU 毕业,加入房地产搜索公司 Trulia (Zillow Group)做机器学习应用。因为我深信未来5到10年,机器学习等高新技术的大爆炸,一定会从纯互联网领域,快速延伸到各个传统的行业中,而房地产行业...
如何评价 DeepMind 在星际中的失利,以及 OpenAI 在 Dota 上的成功?
谢邀 两者都很成功,但是 OpenAI 更擅长宣传。 星际哪怕最简单的 1v1 都需要同时控制大量单位,这与 dota 中 1v1 只需要控制一个单位难度差别很大。两者都证明了在复杂游戏中人工智能已经可以完成相对简单的任务,但暂时还无法完成整个游戏:DeepMind 在星际中已经精通挖矿,建造,控兵,但无法正常比赛。O...
下一段旅程……
与 Trulia 最后一次合照,归还了工牌,挥挥手,离开了这家工作了两年半的公司。 这是我第一份全职工作,完完全全地改变了我,让我从一个 Naive 的学生状态成长了很多。 我工作的内容一直在尝试各类机器学习的应用,包括图像识别的应用,自然语言理解与生成,推荐系统等等。积累了很多的经验,特别是一些观念上的改变。 技术上...
能否训练一个AI模型来预测房价,寻找投资机会挖掘价值洼地?
谢邀 在数据丰富的地方当然是可以做的。比如美国的房屋买卖数据依照法律要求是公开的,每一栋房子的基本信息,购买人信息,以及购买价格都是可以被所有人查到的。因此,房屋估价在美国有不少房地产科技公司做。常见的比如 http://Zillow.com 的 Zestimate 是一个做了上十年的房屋估价算法。有的公司,比如大佬 ...
如何看待 Kaggle 发布的 Zillow 房价预测比赛?
谢邀 我认为这是一个非常有意思的比赛,特别是每一轮的测试集都会用实际的数据作为评判依据,依照真实买卖房价作为结果,这与以往普遍的机器学习比赛都不同,而更像金融投资比赛。这也会让更多的机器学习的爱好者多去思考千变万化毫无道理的真实世界,而不仅仅生活在理论与代码之中。 正所谓知己知彼,百战不殆,虽然作为公司内部人士,不能参...
Zillow Prize: 百万美刀奖金的房价预测比赛
入口: Zillow Prize Announcing Zillow Prize, a contest designed to inspire the brightest scientific minds to compete to improve the Zestimate® home valuation algor...
机器学习 假设空间问题?
谢邀 因为每个属性的值除了三个可能取值以外还有一个通配符,比如色泽的四种取值是:青绿、乌黑、浅白、通配符
如何评价王垠的文章《我为什么不在乎人工智能》?
机器学习对世界的改变之大,是不能忽视的。 但人们却容易低估已经被创造出来的东西的智能程度。要是十年前说自动驾驶,一定觉得那是人类智慧集大成才能发明的东西,说电脑围棋打败人类,一定是机器的掌握了一种极为先进的学习方法。突然间这些我们都做到了,但是突然间大家都觉得这些成就是 Trivial 的了。自动驾驶仅仅是图像识别的进...
大一计算机学生如何学习机器学习?
谢邀 如果是想系统性地学习机器学习,我认为良好地数学基础是必不可少的,因此,可以提前把相关数学课程学完,比如微积分、离散数学、概率与统计,再开始学习机器学习比较合适。 经常有人纠结地问我大几应该学什么,我也只能纠结的回答这个跟大几没有关系。知识就像技能树,你要点高级技能,就要把低级技能点满,这个跟你何时点没有关系。 至...
如何作大死地为创业公司招聘第一位数据科学家
前两天读了一篇文章,讲一个创业公司招收第一位数据科学家的虚构故事,充满雷坑,让人读起来妙趣横生。在数据方面工作两年,感觉深有同感,因为原文是英文,在这里简单翻译,与大家分享。有能力的还是读原文:来自 Monica Rogati 的 How not to hire your first data scientist - ...
图像识别(CV)在房地产领域的应用
过去两年,我们 Trulia Data Science Team 探索了大量图像识别(Computer Vision)在房地产相关的应用,在 Trulia 上线了一些,并发布了一些博客,在这里一并总结一下。 相关博客: Image Recognition Technology What Makes a Photo Cl...
自然语言生成(NLG)在房地产领域的应用
最近在公司的博客发了一篇技术文章,关于我们组在2015~2016年期间完成的一个自然语言生成的项目,生成的内容是地区的描述(Location Description),要覆盖美国大概十万个城市(City)、小区(Neighborhood)和邮政编码(Zip Code)。博客本身更多是公关与宣传,而不是学术交流,所以细节...
如果有第谷的数据,现在的机器学习,深度学习有办法学出开普勒三定律吗?
简单来说是不能,但只是不能明确表达出这种形式,但我们并不知道它是不是已经学会了。因为现在机器学习的主流方向主要是解决明确的问题,比如人脸识别、机器翻译、推荐系统等等,在如何理解模型的方面的研究并不足够火热。倘若有一天这些问题人类都解决了,下一步的大热研究方向,可能就是去理解,机器学习到底学习了什么。 对于机器智能一直有...
如何评价知乎用户『大盗贼霍老爷』的微信公众号文章《知乎作了什么恶》?
与之相反,我从知乎获得的信息质量越来越高,我非常欣喜地看到知乎核心信息流算法的开发进展很大,也祝愿知乎早日发布精准的广告平台。 早期邀请制,因为社区小,人与人之间都熟,所以好控制,质量高。 中期有段时间知乎的内容质量是差强人意的,核心原因是,信息传播主要依赖用户的点赞行为,导致大V控制了网站的内容走向,热点内容充斥,群...
这一波人工智能泡沫将会怎么破灭?
谢邀 泡沫的破灭是商业周期的变化,是人类金融社会机制的正常现象,但泡沫的出现与否都不能掩盖机器智能快速发展的事实。因此,与其关注金融现象,不如多思考如何理解机器智能发展的规律,加以利用,把握先机。 人类对于机器智能的发展,有一个非常大的局限性,就是把人类的思考方式,作为衡量是否智能的标准,导致容易错误地估计机器智能的发...
2016
做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大?
谢邀 对能力促进的程度是一个非常主观的判断,这取决你你对自己的定位,以及对于大趋势的理解。我在这里分享一下我思考的过程,希望有所帮助。 我一直在尝试做机器学习在各个领域的应用,特别是小众领域的应用。在 CMU 的时候我花了大概一年的时间研究机器学习和法律领域的结合,并发表了论文,积累了不少如何踏入陌生领域的经验。我在之...
如何评价谷歌的「人工智能先行」(AI First)战略?
谷歌提出 AI First 是一个非常有魄力的决定,我非常认同这个大战略。 虽然 AI 的定义非常模糊,但是广义来讲,也包括各种流行词汇,比如 Big Data, Machine Learning, Data Mining, Deep Learning 等等。无论是对内应用各类 AI 算法,还是对外提供基于 AI 的服...
如何看待知乎开始植入广告?
希望知乎早日招募到足够多、足够优秀的人才做精准算法,开放广告平台。 我见过很多人特别喜欢 Facebook 上的广告,因为精准。只要算法做得好,广告本身就可以是内容的一部分。
Amazon Mechanical Turk 前景如何?
Amazon Mechanical Turk (MTurk) 是一个并不被大众所了解,严重被低估的平台。它提供了一种标准化的向人类发布任务并收集数据的方式,而且完全由价格驱动,你可以把它想象成一个 Human As a Service。MTurk 继承了 Amazon 一贯不重视 UI 但是重视 API 的策略,对于入...
2016~20 年硅谷需求量最大的是什么方向的技术人才?
谢邀 可以说任何时代,最需要的人,都一样,就是那些既懂得最新的技术,也懂得现在的商业环境,并且有能力把最新的技术应用到目前的市场上的人。每个时代大潮的技术不同,但是这样的趋势是没有变化的。 曾经的“互联网、信息高速公路”时代塑造了一批优秀企业,带来了一个全新的产业;一个充满“云计算、移动互联网”改变了不少企业的经营模式...
美国机器学习方向的 master 找工作前景如何?
谢邀 机器学习的应用在工业界需求很高,有过工作经验的人可以很轻松的找到工作,供给远远小于需求,而且需求越来越大。 但是招 New Grad (PhD 可以考虑) 相对较少。原因很多,简单来说,就是 New Grad 往往工程经验不够,学术能力也不够。工业界的现状不复杂:大公司搞机器学习的组大、人多、要求高,PhD 是进...
截至 2016 年 3 月,机器学习、数据挖掘、计算机视觉等的泡沫有多大?
谢邀 现在,2016年6月,机器学习、数据挖掘、计算机视觉等应用毫无泡沫,甚至远远没有发挥算法应有的潜力。 从我在 Trulia: Real Estate Listings, Homes For Sale, Housing Data 工作的经验来看,公司几乎每一个产品线都有可以算法化的地方。同时,不少新的算法可以带来全...
我组招人啦,Sr. Data Scientist: CV & DL
我组招人啦:Sr. Data Scientist: CV & DL 链接直接申请:Trulia - Senior Data Scientist- Computer Vision & Deep Learning 欢迎有过在图像识别和深度学习有过工作经验的工程师、科学家申请。如果你是PhD/Master毕业生,但已经有过大...
有哪些比较好的机器学习、数据挖掘、计算机视觉的订阅号、微博或者是论坛?
谢邀 Data science blogs: GitHub - rushter/data-science-blogs: A curated list of data science blogs 是一个比较长的数据科学、机器学习等内容的博客列表,给了rss,会不断增加。
如何看待人工智能律师的诞生,类似Ross的人工智能律师在中国是否可行?
谢邀 我在CMU硕士毕业的时候的毕业设计,做的是AI&Law相关的研究,之前也写过一点内容: AI and Law, 人工智能与法律(一):欢迎围观 - Hello 陈然! - 知乎专栏 希望大家看看,督促我继续写下去。 总体上我是认同 @梅林 的答案的,由于现在技术的局限性,我们关注的更多的是如何使用技术帮助律师(或...
如何看待 Pinterest 的相似视觉搜索结果?
从技术难度来讲,受益于深度学习的发展,相似图片搜索几乎已经成为一个解决的问题。 在应用的领域,Pinterest 带了一个好头,是一个非常优秀的应用典范。同时,发布的论文 http://www.kevinjing.com/visualsearchatpinterest.pdf 从系统架构来讲,也非常有指导性。 从工程角...
Zillow 数据集怎么下载?
谢邀 Zillow 是全球最大房地产数据平台。大部分的房地产有关数据都已经分门别类整理好,并按照省份、城市、社区等各个粒度提供下载: Data - Zillow Research 同时,受益于美国所有房屋数据Public Records对所有人都开放,以及成熟的MLS系统,从第三方比如 Retsly 也可以通过API等...
2015
CMU硕士还有半年毕业,找工作想专注找到真正热爱的data scientist工作但又怕太冒险怎么办?
谢邀 如果就是为了Data Scientist这个 Title的话,我觉得没有必要担心,现在很多公司也都知道求职者非常喜欢Title,所以也给了很多这个Title的职位的,所以只要你继续努力找,一定会找到一份叫Title叫做Data Scientist的工作。 如果所爱的并不是Title,而是实际工作内容的话,那么就需...
Docker 的应用场景在哪里?
Docker for Data Science at Trulia 和一点感悟 - Hello陈然! - 知乎专栏 我们在Trulia Data Science Team 里面推行了Docker。一方面是搭建API做SOA,另一方面也在帮助每一个Data Scientist 都可以直接从最开始算法分析、开发一直做到部署...