文章、回答、视频、播客和访谈的统一归档 · 全部内容 · 构建与工程 · 90 条 · 第 2 / 3 页
2019
2018
2017
图像识别(CV)在房地产领域的应用
过去两年,我们 Trulia Data Science Team 探索了大量图像识别(Computer Vision)在房地产相关的应用,在 Trulia 上线了一些,并发布了一些博客,在这里一并总结一下。 相关博客: Image Recognition Technology What Makes a Photo Cl...
自然语言生成(NLG)在房地产领域的应用
最近在公司的博客发了一篇技术文章,关于我们组在2015~2016年期间完成的一个自然语言生成的项目,生成的内容是地区的描述(Location Description),要覆盖美国大概十万个城市(City)、小区(Neighborhood)和邮政编码(Zip Code)。博客本身更多是公关与宣传,而不是学术交流,所以细节...
2016
Amazon Mechanical Turk 前景如何?
Amazon Mechanical Turk (MTurk) 是一个并不被大众所了解,严重被低估的平台。它提供了一种标准化的向人类发布任务并收集数据的方式,而且完全由价格驱动,你可以把它想象成一个 Human As a Service。MTurk 继承了 Amazon 一贯不重视 UI 但是重视 API 的策略,对于入...
如何看待 Pinterest 的相似视觉搜索结果?
从技术难度来讲,受益于深度学习的发展,相似图片搜索几乎已经成为一个解决的问题。 在应用的领域,Pinterest 带了一个好头,是一个非常优秀的应用典范。同时,发布的论文 http://www.kevinjing.com/visualsearchatpinterest.pdf 从系统架构来讲,也非常有指导性。 从工程角...
2015
Docker 的应用场景在哪里?
Docker for Data Science at Trulia 和一点感悟 - Hello陈然! - 知乎专栏 我们在Trulia Data Science Team 里面推行了Docker。一方面是搭建API做SOA,另一方面也在帮助每一个Data Scientist 都可以直接从最开始算法分析、开发一直做到部署...
Docker for Data Science at Trulia 和一点感悟
刚刚在 Trulia 的博客上发表了我的第一篇文章:Docker for Data Science at Trulia. -How Trulia’s Data Scientists Minimized Releasing, Testing, and DevOps Efforts with Docker 文章大意,就是我...
有没有什么工具可以帮助理解源代码的?
小黄鸭Debug大法 - Hello陈然! - 知乎专栏
小黄鸭Debug大法
刚入职的时候,公司发了一只萌萌的小黄鸭。 一直以来,我都以为这就是一个萌萌的小玩意,并没有什么luan用。然而,前两天,同组的同事却告诉我一个惊天秘密: 这玩意是用来Debug的! 我的心里简直有一万头草泥马呼啸而过,难道我平日虐待了某种保佑不出Bug的远古神灵?然后我被告知了一种高级的Debug大法,叫做Rubber...
2014
有哪些算法惊艳到了你?
Reservoir Sampling( Reservoir sampling ) 这是我在今年求职过程中面试的时候被问到的,因为之前很少接触Streaming的算法,在听到这个题目的时候被惊呆了,根本不能理解: 给一个Streaming的Data,未知长度,要求在Streaming结束后返回N个Data,且是等概率的。...
法律是否可能被代码化?
虽然目标短期内不可能实现,但是我们可以慢慢逼近嘛 不要因为短期看不到希望就否定研究的可能性 基础研究要一点一滴的做 几十年几十年的做 能出一点成果是一点成果 比如首先 我们可以试图帮助律师更快理解case和regulation,这就是一大步 再然后 我们可以试图帮助律师提高搜索效率,这又是一大步 Modeling的事情...
想成为计算机技术高手,一定要懂汇编吗?
大概在另外一拨人的眼里,成为计算机学科的高手应该是把数学学好,只有把高等数学学好,精通概率、统计、随机过程、抽象代数,熟练掌握各种建模方法,才是计算机科学的王道。再结合各种领域知识,年薪百万轻轻松松。弄点高级算法几十亿被收购瞬间财富自由。 技术只是技术本身,计算机发展了这么多年,无数新技术层出不穷。每个人都靠着自己的专...
有没有什么可以画大型关系图的软件?
ER图和Visio是可以并列的么? 首先你要选择一种建模的语言,比如常见的ER图,IDEF,UML 然后要学习这种语言的规范 接着再找建模的工具,比如Rose,Visio 大型系统的设计必须考虑设计规范,这么几千个点的图就算你画出来也没人想看吧 该分层的分层,该抽象的抽象,才是好的系统设计
计算机的应激性是怎么形成的?
门电路有基本的与、或、非逻辑 意思就是给一个或若干个0或1的简单输入,就回一个0或1的简单输出 进而形成复杂的输入输出 wiki上是这么解释的 在数字电路中,所谓“门”就是只能实现基本逻辑关系的电路。最基本的逻辑关系是与、或、非,最基本的逻辑门是与门、或门和非门。逻辑门可以用电阻、电容、二极管、三极管等分立原件构成,成...
用 LaTeX 撰写的学术论文怎么方便地供老师评注和修改?
Latex是文本文件,所以可以使用Git进行版本管理,进行评注和修改 但是要是老师不熟悉Git的话,那就参照别人的方法把╮(╯╰)╭
2013
为什么手机软件只能以重新覆盖的方式更新而不能以打补丁的方式升级?
现在的“增量更新”差不多就是这个意思了
编译原理是不是计算机基础课程中最难的?
当然不是 因为它背后有很多理论的支持 比如自动机 文法等 而这些理论恰好又比较好出题 比较好实现 所以比较好变成作业 对于不熟悉的人来说看起来往往很难 而真正难得东西 比如OS 往往由于国内没几个老师有能力教的好 所以最后反而让人觉得没那么难了
为什么sublime text2 无法高亮?只有白色和蓝色……
因为文件没有后缀?
如何计算两份代码的相似度?
正好之前的毕设中阅读了相关的文献 这里依照我肤浅的理解也来回答一下 计算两份代码的相似度是有很多实际的应用背景的,比如在代码仓库中(Software Repository)中,大量的代码来自于相互的复制粘贴,如果能够合理地检测到相似的代码,将相似的代码只保存一份,那么可以减少大量的存储冗余,同时也可以更好地保证数据的一...
哪些事情让你觉得「哇!还可以这么干」?
想起了两个神级的排序算法 1. Sleep Sort 输入一组数 A1 A2 ... An, 新建n个线程,每个线程Sleep(Ai),然后输出Ai,就排序好了。。 这可是正儿八经的多线程排序噢!!! 详情: 排序算法 Sleep Sort 2. Bogosort 输入一组数,随机打散顺序,如果不是有序的,继续随机打散...
大一自学计算机,目前在看 C Primer Plus,准备学习的书还有很多。应该按照什么顺序阅读,如何进阶?
别看书了……做点项目去吧…… 不真做做你那看看跟没看差不了多少……
如何用C、C++或者Java调用CPLEX解数学规划?
... 我在GOOGLE搜CPLEX满屏都是教程... 比如IBM的 http://pic.dhe.ibm.com/infocenter/cosinfoc/v12r2/index.jsp?topic=%2Filog.odms.cplex.help%2FContent%2FOptimization%2FDocumenta...
类似「印象笔记整理术」这样的文档/图片如何方便的制作?
word挺好做的呀... 就是一个分栏, 自定义的标题格式, 插入一些图片即可
今年高考,想从事连接虚拟和现实的或者说改进人机交互方式的工作(例子:第六感科技),该选什么专业?
你提了两个方向: 虚拟现实和人机交互. 这是两个现在都存在的院系(方向), 但是差别很大. 虚拟现实(Virtual Reality)一般在计算机相关院系中有实验室, 但是其没有单独成系存在 虚拟现实是图形学下的一个分支, 其类似的还有最近比较火热的增强现实(Augmented Reality) 由于是图形学的一个分支...
2012
在校大学生有没有可能自主研发成功“植物识别器”?如果有可能那需要自学哪些内容?如果不可能的话,为什么?
当然有可能啦 我们大一的大作业就写过搜索引擎呢 当然能用 搜个关键词就能出来匹配的东西 至于好不好用,那就是值得你化一辈子时间去优化的事情了
为什么同个网页不同浏览器打开的反应时间不同?浏览器的选择是否能影响网页打开的速度?
这个事情大概就类似 我丢给你和其他人一堆话 这是原始的信息 你们的理解方式不一样,大脑擅长处理的东西不一样,所以自然速度有快有慢 虽然结果往往差不多
拓词应如何解决一些人反应的「背拓词会上瘾,但是背过之后记得的很少」这一现象?
去掉意思选项1234。使用 记得/不记得 选项。鼓励通过自己反馈来主动记忆单词 拓词适合第一遍过单词,但是背单词是个苦逼活,第一遍过了还得过好多遍,这个时候拓词不好用了。 可以学学云词的单词本,给用户一些自己建立的单词本来 主动维护自己的单词。
为什么很多应用根本就不需要地理位置却还要读取用户的地理位置?
内嵌的广告 或者 统计 插件可能会使用这些权限
大三学生毕业后想做产品经理,应该怎么做准备?
别光看书了…… 不如咱先折腾个大家都爱用的产品出来吧。 想做“产品”方向,不自己先弄个团队自己做产品,该如何学呢?