杰米·肖顿采用的方法,是用手工着色并 于这项研究的时候,接到一个来自微软
标注出物体类别的图像作为训练集,训练 Xbox 产品部门的电话,对方说他读到了
出一个模型,让它可以自动对输入的图像 杰米·肖顿之前发表的论文,想与杰米·肖
中的每个像素做分类和着色。 顿讨论一个“非常重要的机密项目”。对
方详细介绍了这个机密项目的目标:实时
由于出色的研究成果,杰米·肖顿在短短 4 人体运动追踪,这是一种类似于科幻电
年时间里就获得了剑桥大学的博士学位,并 影《 少 数 派 报 告》 中 的 黑 科 技。 之 前 杰
于 2008 年 6 月作为博士后研究员加入微软剑 米·肖顿的师兄,如比约恩·斯滕格(Bjorn
桥研究院的机器学习与感知研究组,他的直 Stenger)曾经把这个问题作为自己的博士
属上级——研究组组长,就是之后成为微软 论文课题。但是当时最顶尖的研究结果离
剑桥研究院院长的安德鲁·布莱克(Andrew 真正的商业化产品至少也有 5 年的差距。
Blake)。 而 Xbox 项目组想在 2010 年圣诞节的时候
发布这个产品。想到这些,杰米·肖顿犹
大约在 2008 年年底,杰米·肖顿正在专注 豫了。
027
更多精彩尽在www.sxpdf.com
似乎是看出了杰米·肖顿的疑虑,Xbox 项 深度数值的精度达到厘米级,足以区分人
目组的人亮出了他们的秘密武器:一种正 脸上的鼻子和眼睛之间的深度差异。
在研制中的深度传感器原型。深度传感器
看起来像普通摄像头,但是输出的图像上 以下是一张深度传感器的输出图像 [3]。
的每个像素的数值是物体的深度(即物体
上的点与传感器镜头之间的距离),而不 有了深度图,人体运动跟踪就容易多了。
是传统相机中的物体的亮度。 首先,由于背景和前景的深度差别较大,
可以很快地把它们与要识别的人体分割
杰米·肖顿以前见过的深度传感器,分辨 开;其次,由于不依赖于亮度,衣服颜色、
率 最 高 不 超 过 10×10( 像 素)。 而 Xbox 肤色、头发颜色、光照明暗这些传统视觉
当时拿出的深度传感器的分辨率可以达到 图像中的干扰因素,都不会影响深度图像;
320×240(像素),并且能以每秒 30 帧的 最后,基于深度传感器的几何定标,可以
速度拍摄。最让杰米·肖顿兴奋地是,它的 计算出人体的真实尺寸。
深度传感器的输出图像
028
更多精彩尽在www.sxpdf.com
即使有了高精度深度传感器这一利器,接 先准备好的人体模型。这些局限性,让这
下来的研究也不是一帆风顺的。主要的挑 个算法不足以直接用于产品化。
战是来自变化多端的人体的形状和姿态。
读者可以闭上眼睛想象一下,你有多少种 Xbox 产品组找到微软剑桥研究院,就是为
弯曲自己右臂的方法,然后再乘上弯曲左 了解决这 3 个困扰他们的问题。杰米·肖
臂的方法,再乘上弯曲双腿的方法,仅仅 顿和微软剑桥研究院的同事安德鲁·菲茨
是这 4 个关节的运动方式的组合乘积,就 吉本(Andrew Fitzgibbon)以及安德鲁·布
有几十亿种,如果再加上头部、腰部、手 莱克一起来攻克这个难题。他们的第一个
腕、脚踝,将远远超过计算机的处理能力。 发现是,视觉可以基于一张静态照片,分
这种由于多自由度带来的复杂性,称为“组 辨出人体的四肢。如果能够训练机器做到
合爆炸”。 这一点,就可以解决使用者必须从固定姿
态初始化的问题,而每次丢失跟踪目标之
为了解决组合爆炸问题,Xbox 项目组采 后,也可以自动恢复跟踪。另一个想法是,
用了逐步跟踪的人体运动跟踪的算法。这 使用概率模型替代确定性模型,让识别算
个算法假设已知人体在前一秒的位置和姿 法适用于更多的不同用户的体型。
态,并且知道人体在下一秒最多可以移动
到哪些位置和有哪些姿态,用一个事先准 杰米·肖顿在剑桥时的师兄比约恩·斯滕
备好的标准人体三维模型,绘制出在这些 格在博士论文研究中,使用了倒角匹配
估计的姿态中深度传感器可能采集到的深 (Chamfer Matching)的方法,可以把静态
度图,并且与实际采集到的深度图作比较。 图中的人体姿态与训练集中的人体姿态大
这 类 方 法, 统 称 为“ 基 于 合 成 绘 制 的 分 致匹配上。但是由于人体运动的多样性,
析”(Analysis by Synthesis)。这个算法的效 需要非常大的训练集,这会延长匹配的时
果非常好,但是它有 3 个局限性:①使用 间,从而达不到实时性的要求。
者在每次开始运动之前,都必须从一个规
定的姿态和动作起始;②如果两秒之间的 于是杰米·肖顿重新设计算法。他们决定
运动过于剧烈,算法就会丢失目标,在试 把人体的各个肢体部位分开来匹配和识
验中一般最多能够维持 10 秒的连续跟踪; 别,以绕开组合爆炸的问题。那段时间,
③这个算法要求用户的体型必须很接近事 设计新的匹配算法这个问题一直在杰米·肖
029
更多精彩尽在www.sxpdf.com
顿的脑海中萦绕,直到有一天他在浴室里 找到了微软硅谷研究院的同事,并基于微
洗澡时,突然灵感浮现:何不把自己的博 软硅谷研究院开发的名为 Dryad 的分布式
士论文中采用的图像分割和物体识别算法 计算系统,把算法并行化以缩短运行时间。
应用到深度图上?此时只需把物体类别换 并行化后的算法,可以同时在 100 台机器
成人体的各个肢体部位就可以了。于是他 上训练,将训练时间缩短到了一天以内。
们把人体分割为 31 个部分,并训练了一个
基于决策树的算法来判断每个像素点分别 现在万事俱备,杰米·肖顿和 Xbox 团队一
属于其中的哪个部分。右图显示了分割后 起,把身体部位识别算法和 Xbox 原有的
的人体图像,其中每个像素的颜色表示它 跟踪算法整合为一套完整的人体运动骨架
属于哪个部分。[4]
的跟踪系统。再加上语音识别、人脸识别
这个算法取得了喜人的结果。当然它还需 等其他黑科技,Xbox 产品部门终于按期完
要很多的工程化努力,才能达到商业产品 成了这个魔法般的平台,让游戏开发者可
所需的精度和速度。为了让训练集的人体 以在上面实现诸如 Kinect Sports、足球、街
模型更为多样,他们找到好莱坞专业制作 舞这样酷炫的体感游戏。
人体三维模型特效的公司,并结合了从演
员的真实运动中捕捉到的轨迹,渲染出了 体感游戏只是一个开始,杰米·肖顿希望
不同体型的人体模型完成跑、跳、打斗、
驾驶等各种运动的姿态。最后的训练集有 这种技术能够运用在虚拟现实和远程会议
数百万张用这种方法合成的深度图。 等场景中。杰米·肖顿凭借他在 Kinect 身
体跟踪中的杰出贡献,被授予“2015 年《麻
最后的一个难关,是如何快速地根据这有
几百万张图片的训练集,得到物体识别模
型。如果使用杰米·肖顿之前的算法在一
台机器上训练,需要几个月的时间才能完
成一次训练。由于需要反复训练来调整参
数,用这种方法根本赶不上 Xbox 产品部
门要求的发布时间。于是杰米·肖顿他们
030
更多精彩尽在www.sxpdf.com
省理工科技评论》35 位 35 岁以下科技创 拿取和移动虚拟物体等操作更加自然。
新青年”的称号。之后,他又把自己的算
法运用在高精度手部运动跟踪中,其成果 杰米·肖顿的手势识别技术,在微软的增
发表在 2016 年的顶级视觉会议上。手部, 强现实(AR)眼镜 Hololens 上也有用武之
特别是手指的运动跟踪,在虚拟现实场景 地。例如,使用者可以用手指来缩放和控
中有巨大的应用潜力。例如,用户戴上虚 制应用程序窗口;还能在空中做敲击键盘
拟现实(VR)眼镜后,能看到自己的手在 的动作,控制增强现实眼镜中的虚拟键盘,
虚拟世界中运动,就可以让虚拟现实中的 更为自然地输入指令。
EmTech 大会
获奖者演讲视频
参考文献
[1] MIT Technology Review.https://www.technologyreview.com/lists/innovators-under-35/2015/
inventor/jamie-shotton/ .
[2] Alumnus Dr Jamie Shotton and the development of Kinect for Xbox 360 [J/OL]. 剑桥大学新闻通讯,
2011-01-20. http://www.eng.cam.ac.uk/news/alumnus-dr-jamie-shotton-and-development-kinect-
xbox-360.
[3] Jamie Shotton’s homepage at Cambridge.http://jamie.shotton.org/work/.
[4] Jamie Shotton’s homepage at Microsoft Research .https://www.microsoft.com/en-us/research/
people/jamiesho/.
031
更多精彩尽在www.sxpdf.com
下一场计算机交互革命
作者:许屹然
距离的不断缩短史。
李镇河(Jinha Lee) 如今,我们与这些数字信息的距离“不到
一毫米”,这个距离也正是触摸屏玻璃的
获奖年份:2014 厚度。那么试想,如果没有边界呢?十几
获奖时年龄:27 年前,来自韩国的李镇河就在思考如何用
获奖时职位:三星集团工程师,IV 实验室主管 双手触摸数字世界。今天,已经成为韩国
获奖理由:让用户与虚拟世界中的数字信息真正实现 三星集团首席工程师兼首席设计师的他在
“零距离”接触。 人机交互领域可谓名声大噪,由他开发的
3D 显示桌面将有可能引发继命令行界面到
如果有一天,手机、计算机屏幕后的世 图形界面之后的又一次计算机革命。
界变得触手可及,这将是一种怎样的体
验呢? 你用任意一款搜索引擎搜索 Jinha Lee,结
果排名第一的一定是以他的名字命名的个
纵观计算机的发展历史,我们与数字信息 人网站 [1],打开网页,一个极具美感与科
之间的距离,真实空间与呈现在屏幕之后 幻色彩的小球随着蓝色背景映入眼帘,整
的虚拟世界之间的距离,正在一点一点地 个首页简洁而又不失典雅。如果你接着看
缩短,所谓计算机的发展史,也正是这些 完李镇河的个人简介和基本经历,用“华
丽”二字来形容一点都不为过。2002 年,
初中毕业的李镇河来到韩国水原的电子科
学高中,在那里,成绩优异的他提前完成
了高中学业。随后,他又以第一名的成绩
拿到韩日政府联合奖学金留学日本,就读
于东京大学电子工程专业。在东京大学的
本科学习阶段,李镇河就展现出了非凡的
032
更多精彩尽在www.sxpdf.com
设计和编程能力。2008 年,还在索尼公司 自己的学业论文,利用无线红外通信技术,
实习的李镇河就在其导师的带领下开发出 将 3D 的块状半透明立方体当成计算机中
了基于云端数据库匹配识别的对象与建筑 的像素点进行人为操作。这一设计一经推
物感知移动应用程序。 出便大获成功,如今 Bloxels 已成为孩子们
乐此不疲的益智游戏。而这是李镇河首次
2009 年,即将大学毕业的李镇河与 Takeshi 尝试将原先显示在屏幕背后的数字信息变
Naemura 教授合作,将 Bloxels[1] 项目作为 成真实可触摸的物理实体。
李镇河的个人网站封面 [1]
除了扎实的计算机功底以外,Bloxels 所展 河说:“当人们欣赏艺术作品时,他们无
示出来的美学理念也展现了李镇河极高的 须刻意去思考,因为可以通过直觉将视觉
艺术天赋。对于 Bloxels 项目的成功,李镇 形状展现出来。”
033
更多精彩尽在www.sxpdf.com
从东京大学毕业后,李镇河来到美国麻省 加了展览。就在 2012 年,由他设计并研发
理工学院(MIT)攻读硕士和博士学位, 的一款名为 ZeroN[1] 的悬浮小球受到广泛
并在麻省理工学院的媒体实验室可触摸媒 关注。这次,ZeroN 悬浮小球以及他最新
体研究小组从事研究工作。这期间,国际 研发推出的 3D 桌面环境 SpaceTop 再次成
一流的科研环境和创造力让李镇河在人机 为展会上人机交互领域的焦点。ZeroN 是
交互领域完成了多项突破性研究,并获得 一个悬浮的 3D 小球,能记录并重现被用
多个国际性大奖。 户移动的轨迹。而 SpaceTop[1] 则是李镇河
最新推出的数字 3D 环境,它帮助用户“进
2013 年,一年一度的科技盛宴 TED ①大会 入到”计算机屏幕的内部,以操纵现实世
在美国加州长滩举行,此时正在微软应用
科学部门实习的李镇河带着他的新作品参 界物体的方式去操作网页、文档和视频,
同时还能通过手势实现更复杂的功能。
极具科幻色彩的 ZeroN 悬浮小球 [1]
① TED 是 Technology(科技)、Entertainment(娱乐)、Design(设计)的缩写。
034
更多精彩尽在www.sxpdf.com
在 SpaceTop 系统中,李镇河采用了全透明 茨(Bill Gates)曾把我们从最原始的命令
的 LED 显示屏,同时配备两个深度摄像头, 行界面带到可以看得到的 Windows 图形界
其中一个摄像头用于追踪用户的手势,而 面,乔布斯(Steve Jobs)则给我们带来了
另一个则用于跟踪用户面部的位置,根据 更好看的 Macintosh,这当中也是好几代人
用户的目光所在的位置调整投影角度。虽 努力的结果。比尔·盖茨和乔布斯都从施
然目前 SpaceTop 3D 仍处于初级阶段,但 乐公司在这方面的研究中学到了很多。同
该系统也是第一次实现了用户手势控制与 样,我们从按键发展到触摸,又花了几十
3D 界面的深度融合,它的推出在业界看来 年的时间。如今,像李镇河这样的创新者
将标志着人机交互技术开始迈向“质的飞 们势必会更快地把我们带向下一次革命。
跃”。其实回过头来看,这种质的飞跃在
人机交互领域也是屈指可数的。比尔·盖 在接受媒体采访时李镇河曾说,SpaceTop
有可能引领下一场计算机视觉革命的 SpaceTop 3D 显示桌面 [1]
035
更多精彩尽在www.sxpdf.com
和 ZeroN 代表了一种趋势,即我们可以用 “编程整个世界”。
手抓住的界面。人们通常更喜欢通过实体
界面来操作,如使用地图和白板;而且喜 根据韩国宪法,年龄达到 20~30 岁的男性
欢通过多种方式来互动,例如,在看书的 必须服兵役。2014 年,在麻省理工学院已
时候做笔记或者标注重点。像 SpaceTop 和 经小有一番成就的李镇河从媒体实验室请
ZeroN 这样的系统要想获得成功,细节非 假,回国前往三星公司开发下一代计算界
常重要,例如,用户的胳膊要伸多远,什 面,并以从事非军事性勤务的方式代替义
么时候建议用户使用 3D界面比较合适等。 务服兵役。而此时的韩国三星集团也正在
所以,这项技术值得一些善于“精炼”技 多媒体领域寻找新的突破点。就在李镇河
术的公司关注,如微软,甚至是苹果。平 回国工作期间,一次小型家庭聚会给了他
板电脑曾经被人们冷落在一边,默默无 工作灵感,他的母亲在聚会上突然想起她
闻,是苹果公司“精炼”并普及了平板电 的手机上有个视频,想要分享给大家,并
脑。现在,3D 桌面似乎会有一个良好的 让大家在电视上观看,结果找了半天也没
开局 [2]。 有找到这项功能,最后只能通过通信软件
才将视频传给亲友观看。看到这一幕的李
牛顿曾因为当时的数学手段无法解决其 镇河觉得,这样拿着手机传来传去,效率
研究的问题,从而自己提出了微积分的 太低,而且流程也太不合理,于是决定改
概念。李镇河也是如此,为了更好地使 变这一切。
用 3D 桌面环境,他还自己研发出了一款
专门用于 3D 人机交互的收缩笔,这款神 而这便成了日后三星推出的 MediaSquare
奇的收缩笔甚至可以插入计算机屏幕中, 计划,这一计划希望让原本单一且毫无互
在笔收缩的过程中,其前端缩进去的部 动的电视,通过每个人手中的智能手机变
分会显示在屏幕内部,用户可以使用这 得更有“人情味”。在李镇河看来,未来
款产品在屏幕中随意变化其收缩长度来 看电视的氛围将从呆滞变得更为活泼,人
制作三维图像。对于这些,李镇河表示, 人手中的智能手机都能决定电视上何时投
这些产品的共同之处在于能将现实世界 放出想要跟大家分享的照片、视频,甚至
和数字世界更紧密地结合起来,从而实 是餐厅信息等。目前可以肯定的是,未来
现自动化的实体互动。为此他将其称作 在三星安卓(Android)手机以及三星电视
036
更多精彩尽在www.sxpdf.com
上将会配备这一功能,电视社交将成为科 握在科学家的手里,而是应该掌握在普通
技实现家庭团圆的一大亮点。 人的手里,因为我们打算用它做的事情,
是设计一个美丽的世界,所以记得这一点
如今,作为三星集团首席工程师兼人机交 非常重要。当数字的力量超越屏幕的束缚
互部门经理的李镇河,在他的个人网站上 时,它的发展会有各种各样的可能性,但
同样展示了他在摄影、绘画等领域的不凡 是我们大家应该一起来设计这个美丽的世
成就。在他心中,艺术和科技从来就不应 界,这是我们的责任”。
该被割裂开来。对于科技,“它不应该掌
参考文献
[1] Lee J H. An interaction designer and inventor creating future user experience. [EB/OL]. http://www.
leejinha.com.
037
更多精彩尽在www.sxpdf.com
每个人都是自己
的制药工厂
作者:许屹然
很多药物的使用群体都在迅速缩小。眉
毛胡子一把抓的用药方式也将逐渐被一
人一药的“个体化用药”方式所取代。[2]
卢冠达(Timothy K. Lu) 然而,在个体化用药时代,患者显然承
担不起工厂私人定制药物所带来的成本。
而这,正是卢冠达所想也正在着手解决
的艰深问题。这位麻省理工学院的“80 后”
华裔科学家,正在试图利用合成生物学
技术颠覆传统制药业。
获奖年份:2010 一说起在麻省理工学院任职的华裔科学
获奖时年龄:29 家,也许大家第一个想到的就是从事基
获奖时职位:麻省理工学院生物工程学院副教授 因编辑研究的张锋。然而,在合成生物
获奖理由:以“毒”攻“毒”,用自制噬菌体破坏生物膜, 学领域,卢冠达也可以说是成果颇丰。
降低生物膜对抗生素的防御能力,真正让药效直达 自 2010 年加入麻省理工学院以来,如今
病灶。[1] 这位年仅 36 岁的青年才俊已是麻省理工
学院电气工程和计算机科学学院与生物
如果现在说当我们每个人生病的时候, 工程学院的副教授,并已成为麻省理工
能够用上那些根据个人不同体质专门适 学院合成生物学研究小组的负责人,他
用于自己身体状况的药物,你可能还觉 的成绩让业界的有些人称他是“合成生
得很遥远。 物学领域的思想家”。更令人不可思议
的是,这位“80 后”学术大牛,在学术
实际上,早在 2015 年,美国政府就已经 上可以说是一位名副其实的跨界达人,
提出“精准医疗”这一概念。未来,药 纵观他的学术背景,横跨电气工程、计
物的适应证将会被划分得越来越细致,
038
更多精彩尽在www.sxpdf.com
算机科学、合成生物学以及医学等多个
领域,同时掌握着计算机技术、遗传学
技能和临床知识。
童年时期的卢冠达一半时间在美国度过, 卢冠达(右)和他的父亲卢超群(左)
另一半时间在中国台湾度过。他的父亲
是中国台湾地区半导体产业的重量级人 于食品供应商来说,无须增加样本数量,
物、钰创集团董事长卢超群。1999 年, 只需安装一个成本约 5000 美元的现场照
卢冠达赴美求学。在麻省理工学院电子 明箱,然后购买 Sample6 公司提供的装有
工程及计算机科学专业取得本科及硕士 特殊噬菌体的一次性塑料袋,用来与待检
学位后,卢冠达来到波士顿大学,师从 测样本充分结合。该技术易于操作,只接
著 名 的 合 成 生 物 学 家 吉 姆·柯 林 斯 (Jim 受过高中教育的人就能使用,食品加工商
Collins), 开 始 了 他 的 博 士 学 业。 在 那 在 6 小时之内就能现场确定食物样本是否
里,他再次过着一种跨界生活:他的导 被污染。[2] 目前,Sample6 在全球有 40 多
师实验室位于波士顿大学校内,然而他 家客户,其中包括联合利华(Unilever)、
的学位授权机构却在哈佛大学(Harvard Smith eld 和 Saputo 等。
University)和麻省理工学院。这种多文
化的交流和学习也让卢冠达能够最大限 在接受《麻省理工科技评论》独家专访时,
度地接受合成生物学领域最尖端、最前 卢冠达表示,生物医疗在美国是很特别的
沿的科学进展。
早在 2009 年,还在读博士的卢冠达就开发
了能够分解生物膜的生物工程噬菌体。通
过与两名研究生合作,卢冠达依靠这项技
术成立了他人生中的第一家生物技术公司
Sample6,为人们提供检测食品是否被细菌
污染的定制噬菌体。当食物中的细菌遇到
这种噬菌体时就会发光,类似萤火虫。对
039
更多精彩尽在www.sxpdf.com
产业,公司不是一下子就能创造利润的, 卢冠达自己的话来说就是,“在实验室里
而且还有一个美国食品药品监督管理局 做的研究是针对某一应用的,但是最适合
(Food and Drug Administration,FDA) 的 这个技术的商业应用,可能跟你想象的完
高门槛。“我们在美国经历过生物技术很 全不一样”。2009 年时整个社会对新的
热的时候,现在投资者也变得很专业化, 抗菌技术缺乏兴趣,因为抗生素已经很便
生物医疗研究最重要的就是有数据,如果 宜,因而人们对抗生素的前景不是很看
一家生物公司不把数据拿出来,那就是 好,这也让卢冠达在寻找资金来源方面碰
陷阱!” 了很多钉子。直到他将目光从治疗疾病转
移到食品安全领域,才吸引到了资本的
其实早在 Sample6 成立之初,卢冠达就想 青睐。
用噬菌体来降低生物膜对抗生素的防御能
力,从而对人类疾病进行治疗。然而,用 2010 年,卢冠达受聘进入麻省理工学院医
040
更多精彩尽在www.sxpdf.com
学院,他也开始带领着实验室里的 26 名成 力,卢冠达还在积极探寻如何使用合成生
员研究一系列合成生物学问题,内容涉及 物学的方法来跟踪、监视并记录人体细胞
基础科研和实际应用中的各种问题。在这 如何从正常走向病变。也是在 2014 年,他
当中,他仍重点研究抗生素的抗性问题。 将大肠杆菌的基因组改造成了长期记忆的
近年来,全球出现了一些新的细菌菌株, 储存设备。为了编程大肠杆菌来储存记忆,
这些菌株甚至能够抵抗最强效的抗生素。 他和同事们改造细胞,生成了一种重组酶,
在美国,包括耐药结核菌和葡萄球菌在内 可以将 DNA 或是特异的单链 DNA 序列插
的细菌每年都会造成 200 多万人感染,至 入到靶位点中,而且只有当存在一种预定
少 2.3 万人死亡。尽管人们对新的治疗方 分子或者其他类型的输入信号时才能激活
法有着迫切的需求,但是在过去 10 年里科 这个 DNA。当这个 DNA 生成以后,重组
学家们只发现了极少的新型抗生素。 酶就会将这个 DNA 插入细胞基因组中的
预编程位点。一旦这个过程被记录下来,
2014 年,已经成为麻省理工学院合成生物 这种记忆就可以在菌群中终生储存,并一
学研究小组负责人的卢冠达,带领他的研 代代向下传递。
究团队在自然科学顶级期刊《自然·生物技
术》(Nature Biotechnology)上发表了对抗 未来,这一技术可以用来设计一些生活在
这些超级细菌的强大武器。他利用基因编 人类消化道中的细菌,来检测人体的饮食
辑系统使得赋予这些超级细菌耐药性或致 摄入,如糖或脂肪的消耗量,还可以检测
病能力的目的基因丧失功能,并且能够选 肠易激综合征引发的炎症。
择性杀死携带着有害基因的细菌。同时,
在卢冠达的实验报告中,一种新型的对抗 如今,卢冠达和他的博士生导师 Jim Collins
耐药菌的方法已经被研究出来。他们鉴别 联合创办了合成生物学公司 Synlogic,它
出了一些基因的组合协同作用可使得细菌 承载着卢冠达的梦想。文章开头提到的正
对抗生素更为敏感。因此,他的这篇文章 在颠覆传统制药业的技术,也正是这家公
也为寻找新的方法来对抗抗生素耐药性提 司的核心竞争力。卢冠达利用合成生物学
供了两种不同的策略。 技术发明了一款微型生物反应器,通过这
个反应器可以合成患者需要的蛋白类药物
除了在对抗当前抗生素耐药性方面的努 (如多肽、胰岛素、疫苗和抗体药物等)。
041
更多精彩尽在www.sxpdf.com
实际上,利用合成生物学方法制药已经不 程菌只能用于生产一种药物的问题。截至
是什么新鲜事儿了,但是如何能够最安全、 目前,Synlogic 已经有了 10 种在研药物。
高效、便捷地满足极少数不同患者的药物
需求,依旧是个大问题。计算机专业出身 就在前不久,Synlogic 进行了 FDA 第一期
的卢冠达巧妙地把计算机思想带入合成生 人体治疗。对于一家生物医药公司来说,
物学领域,给传统用来制药的工程酵母菌 2014 年成立、2017 年就能开展临床试验,
安装上了生物电路。这种生物电路可以随 无论是从商业还是科研角度来评价,发展
时随着周围环境物质的变化改变生产的药 速度都是惊人的。
物,从而巧妙地解决了以往的一种制药工
Synlogic 在研的 10 款药物、适应证以及研究进展(图片来源于 Synlogic 官网)
042
更多精彩尽在www.sxpdf.com
一路走来,卢冠达不断突破自己,勇敢探 趋势,卢冠达认为,其将会与半导体领域
索新的领域。在学者和创业家之间,在多 的摩尔定律很相似,每一年可读取、编辑
个交叉学科当中,卢冠达始终知道自己在 DNA 的数量、效率都会翻倍,同时成本显
做什么、要做什么、对于基因研究的未来 著下降。
参考文献
[1] MIT Technology Review. MIT Technology Review Innovators Under 35[EB/OL]. http://www2.
technologyreview.com/tr35/profile.aspx?trid=967.
[2] Kerry G. Timothy Lu: Niche Perfect[EB/OL]. http://www.the-scientist.com/?articles.view/
articleNo/45873/title/Timothy-Lu--Niche-Perfect/.
043
更多精彩尽在www.sxpdf.com
汗水与梦想
作者:孙振标
高伟(Wei Gao) 高伟出生在江苏徐州的一个小村庄,山上
走兔,林中睡狐。每个不甘平凡的孩子都
获奖年份:2016 会对外面的世界多一分好奇;每个怀有好
获奖时年龄:31 奇心的孩子都会在头脑中多一分想象;每
获 奖时职位:加州大学伯克 利分校(University of 个充满想象力的孩子都会在心里萌生一颗
California, Berkeley)博士后 梦想的种子。当那个心怀憧憬的少年走进
获奖理由:这位年轻工程师发明的智能吸汗带可以 医院,看到医院精密的医疗器械时,他并
实时监控身体机能。 没有惊叹医疗技术之先进,相反,他有一
些失望。他觉得简单才是美,而这些由导
2016 年 8 月 23 日,《麻省理工科技评论》 线连接的机器都太过复杂。或许,就是在
公布了第 16 届“35 位 35 岁以下科技创新 那时,一颗种子已经在那个懵懂少年的心
青年”榜单,31 岁的加州大学伯克利分校 中埋下。后来,高伟目睹了周围的很多人
博士后高伟入选“发明者”榜单。随后, 因各种疾病而离世,他的外婆也因脑血栓
清华大学和华中科技大学都向自己的校友 去世。这一切来得如此突然,让人猝不及
表达了祝贺。曾经承载高伟儿时梦想的母 防。高伟开始思考:很多人对自己的身体
校,如今成了他荣誉的见证者。 状况一无所知,等到发现问题时,往往为
时已晚。他开始意识到,现实并非如想象
中那么无所不能,医学也没有发展到尽善
尽美。或许,未来的人们能研发出实时监
控人体健康的医疗设备;或许,他能为这
个不太完美的世界尽点绵薄之力。
2003 年,高伟进入华中科技大学机械学院
学习机械设计。2007 年,本科毕业的高伟
又考入清华大学攻读硕士学位,研究方向
044
更多精彩尽在www.sxpdf.com
为微机械谐振式传感器。在清华大学学习 “杰出青年学者夏季研讨会”上做了精彩
期间,高伟领导了一个课题小组,研究设 报告。1966 年,根据阿西莫夫同名科幻小
计了基于微悬臂梁的谐振式气体传感器。 说改编的电影《神奇的旅程》(Fantastic
牛刀小试,高伟从这次研究经历中积累了 Voyage )在美国上映。《神奇的旅程》讲
很多宝贵经验,也为他日后的课题奠定了 述了一名受重伤的苏联科学家逃到美国,5
基础。 名医生缩小到微米尺度进入这位科学家的
体内,最后拯救了他的生命的故事。这部
2009 年,高伟前往美国加州大学圣迭戈分 电影激发了人们对未来医学的想象。高伟
校攻读化学工程博士学位,师从著名电化 指出,在现实世界中,纳米尺度的物体由
学专家约瑟夫·旺(Joseph Wang)教授。后来, 于缺乏惯性,很难在人体的血管内漂流。
他又进入加州大学伯克利分校,加入艾 而如果利用合成纳米电机,将能量转化为
里·杰维(Ali Javey)的实验室进行博士后 动能和推动力,电影《神奇的旅程》中的
研究。在攻读博士学位期间,高伟主要从 伟大科学愿景就有可能实现 [2]。人类活动
事纳米机器人方面的研究。由于在国内打 可以上至九天,下临五海,但在人体细胞
下了良好的微纳米机电基础,高伟在国外 这样微小的空间内却无计可施。这个问题
的研究可谓顺风顺水。2012 年,高伟由于 困扰了科学家很多年。最终,高伟团队从
在先进纳米机器和生物医学应用方面的杰 大自然中获得了灵感。他们模仿植物螺旋
出表现,获得了霍华德·休斯医学研究所 导水管结构,设计出了首个仿生磁驱动螺
(Howard Hughes Medical Institute, HHMI) 旋式“纳米鱼机器人”。这个“大自然的
颁发的国际学生研究奖学金。该奖项旨在 馈赠”不仅制作工艺简单,成本低廉,还
资助那些处于科研转折点、具有潜力的国 在靶向给药方面有广泛的应用前景 [3]。高
际研究生,在他们攻读博士生涯的第 3 到 伟团队的研究成果被选为意大利全国性大
5 年,每年提供 4.3 万美元的资金支持 [1]。 报《共和报》(La Repubblica)的封面文章,
有了这笔奖学金,高伟可以在未来 3 年内 GreenBiz 网站还将其评为 2013 年 10 大最
专注于自己的研究。同时,他也对自己颇 优生物仿生技术之一。随后,高伟不断在
具挑战性的研究项目更有信心。 纳米机器人及其生物应用方面取得突破,
PhysOrg、ScienceDaily 等知名科学网站多
2013 年 8 月,受华盛顿大学之邀,高伟在 次对其研究成果大加赞赏。这也让他收获
045
更多精彩尽在www.sxpdf.com
了很多荣誉,包括两次美国材料研究学会 的梦想,心里的那颗种子也开始显示出愈
(MRS)研究生奖,在 2013 年美国化学工 加旺盛的生命力。随着知识的积累,儿时
程师学会年会上获得生物纳米技术研究生 的憧憬也日益清晰,于是高伟开始研究个
奖第一名。国家留学基金委还在 2013 年授 性化医疗装置。我们的身体无时无刻不在
予高伟国家优秀自费留学生奖。 制造数据。目前市场上已经有小米手环、
苹果手表等多种可穿戴设备,但它们大多
1959 年, 著 名 物 理 学 家 理 查 德·费 恩 曼 数只能进行物理测量,即只能测量人体运
(Richard Feynman)在物理年会上发表了 动量和生命体征,而不能提供分子层次的
经典演讲“物质底层大有空间”( ere’s 信息。体液是人体信息的数据库,但如果
Plenty of Room at the Bottom),最早提出了 要进行实时监控,汗液无疑是理想的检测
纳米思想,即通过操控原子来实现化学合 对象。一方面,汗液的获取是无创的;另
成。费恩曼点燃了科学家的想象力,其中著 一方面,由于汗液的产生与组成非常复杂,
名的当数纳米技术之父埃里克·德雷克斯勒 如果能够设计一种全集成的可穿戴设备来
(K. Eric Drexler)。1986 年,埃里克·德雷 检测汗液里的各种成分,将能够获取关于
克斯勒发表著作《创造的发动机》,他提出 人体生理健康状态的很多信息。
用原子堆叠机创建微小装置,在人体毛细
血管中穿行并修复受损细胞。在那个年代, 最终,高伟团队研发了可穿戴汗液传感器:
这一大胆的想法近乎科幻。2015 年,高伟 一条集传感器、微处理器、蓝牙通信模块
在博士工作的基础上继续深入研究。团队研 于一体的柔性印制电路板。它可以实时且
发了以体液为驱动燃料的新型微机械装置, 精准地检测人体表皮温度,并能详细解读
并且利用锌基微电机在小鼠胃中进行首次 汗液内的代谢物和电解质信息。由于某些
体内实验。该研究不仅是纳米机器人技术 化学传感器(如葡萄糖和乳酸传感器)的
的巨大进步,还为这一新兴领域在临床上 输出会受到温度变化的影响,因此高伟在
的应用叩开了大门 [4]。30 年后,当初那些 系统里集成了皮肤温度传感器,可以用来
不可思议的科幻,正逐步变成触手可及的 实时校准其他传感器的读数。为了佩戴方
现实。 便,高伟把它设计成防汗带样式,由小型
可充锂电池供电,能耗很低。所获得的人
在科学界崭露头角的高伟并没有忘记儿时 体健康数据可以无线传输至用户手机的
046
更多精彩尽在www.sxpdf.com
APP 上。设备表面有一层涂覆材料以防止 离的,工作时可以非常方便地通过柔性印
汗液的腐蚀。此外,高伟的可穿戴汗液传 制电路连接器连接。他将传感器电极制作
感器中柔性电路部分和传感器部分是可分 在不可拉伸的柔性塑料基底上,并且覆盖
高伟发明的智能汗带
047
更多精彩尽在www.sxpdf.com
高伟戴着柔性印制电路
板制成的智能汗带
了一层吸水膜。塑料基底能够大幅度地减 予“2016 年《麻省理工科技评论》35 位 35
少汗液挥发带来的影响,而吸水膜则能吸 岁以下科技创新青年”称号。
收一定量的汗液用来维持稳定的电化学测
量。防汗带在运动中会有弯曲形变,但是 至此,昔日青葱少年心中的那颗种子终于
并不会被明显拉伸。高伟团队通过实验证 结出了果实。如今已过而立之年的高伟,
实,运动中产生的弯曲形变并不会对传感 看上去仍旧是那个不甘平凡的孩子,那个
器的表现带来显著的影响。 心怀好奇的孩子,那个充满想象的孩子。
因为,那颗种子始终在奋力生长。未来,
这款汗液传感器在人们日常的生理健康监 它也许会长成参天大树,荫蔽一方人。
测和临床医学上都有广泛的应用前景。有
医师指出,汗液可用于检测血糖(糖尿病)、 高伟的履历称不上传奇,他也算不上天才,
尿素和肌酐(肾病)、甲状腺激素(甲状 但高伟绝对可以被称为榜样。他从一个小
腺疾病)、性激素等。高伟将这项研究成 镇少年,逐步成长为清华才子、优秀留学
果发表在《自然》期刊上,他也因此被授 生,再到世界杰出的青年创新者。一路走
048
更多精彩尽在www.sxpdf.com
来,其中的酸甜苦辣,也只有他自己能够 了那句女儿等了 10 年的话:“你是我的骄
体会。电影《摔跤吧!爸爸》的结尾,吉 傲!”或许,每个人都能凭着一己之力,
塔获得了世界级金牌,父亲马哈维亚说出 赢得心中期盼已久的那句话。
参考文献
[1] Wei Gao[EB/OL]. http://www.weigaonano.com/.
[2] Gao W. Synthetic Micro/Nanomachines and Their Applications:Towards' Fantastic Voyage'[J].
2014.
[3] Gao W, Feng X, Pei A, et al. Bioinspired helical microswimmers based on vascular plants[J]. Nano
letters, 2013, 14(1): 305-310.
[4] Gao W, Dong R, Thamphiwatana S, et al. Artificial micromotors in the mouse’s stomach: A
step toward in vivo use of synthetic motors[J]. ACS nano, 2015, 9(1): 117-123.
049
更多精彩尽在www.sxpdf.com
在苹果和谷歌之间 时,虽然时不时还得寻求父亲的帮助,但
寻找设计的价值 他自己基本可以独立操作这台苹果公司
的早期作品。他惊讶于这项产品的设计
作者:杨立中 之精妙,竟然让一个 3 岁小孩都可以熟练
操作。当家人和朋友问他“你将来想做什
么工作”的时候,他都会回答道:“我想
为苹果工作。”对于这个天真的想法,大
家总会说:“哦,这很好啊,马特·罗杰
斯。”但没有人想到,他真的这么做了。[1]
马特·罗杰斯(Matt Rogers) 为了让这个童年的“梦想”成真,马特·罗
杰斯付出了艰辛的努力。十几年后,已经
获奖年份:2013 在卡内基梅隆大学读大三的马特·罗杰斯
获奖时的年龄:30 申请成为苹果公司的实习生,并死死缠住
获奖时的职位:Nest 联合创始人 苹果的员工,硬生生磨出一个职位。那个
获奖理由:开发出智能恒温器等一系列产品,成为智 夏天,他用 3 个月的时间承担了一项异常
能家居行业的开拓者和引领者。 繁重的工作——重写所有 iPod 的代码。为
了完成这个任务,他每天工作 20 多个小时,
一个人会有多想为一家公司工作? 一周工作 7 天,几乎不睡觉,让这三个月
变得像一年一样漫长。他出色的工作为他
多数人讲起自己的职业选择时,都是从求 赢得了一笔丰厚的奖金,而据 iPod 之父、
学阶段的某一时刻甚至是大学毕业以后才 马特·罗杰斯后来的上司,同时也是 Nest
开始的。但是,马特·罗杰斯却声称,他在 的创业伙伴托尼·法德尔(Tony Fadell)后
3 岁时就想好了要为苹果公司工作。那年, 来的回忆,从没有过实习生能够做到这么
他的父亲给他买了一台麦金塔(Macintosh) 厉害。
计算机,他像着了魔一样每天玩好几个小
050
更多精彩尽在www.sxpdf.com
马特·罗杰斯和托尼·法德尔
毕业之后,马特·罗杰斯顺利留在了苹果 杰斯后来带领 40 人的团队,负责过 nano、
公司,从 iPod 固件开发做起,直到设计了 shu e、iPhone、iPad 和 Apple TV 等 一 系
第一代 iPhone 的原型机。他和同事花了 4 列项目,彻底从一个坚定的逐梦者成长为
个月构建初始模型,后来还经过两轮迭代。 业内顶级的软硬件专家。而苹果的坚韧封
发布前 4 周,马特·罗杰斯和同事专门去 闭的工作作风和简洁易用但设计精美的风
中国,找人手工打造了最早的 200 台机器。 格也深深地融入他的血液里。他和乔布斯、
团队分日夜两班,昼夜不停,这才有了乔 沃兹尼亚克一样,设计着 3 岁的儿童都可
布斯那次改变了世界的惊艳亮相。 以简单操作但又强大到可以重新定义整个
行业的产品。
有了 iPhone 的经验,20 岁出头的马特·罗
051
更多精彩尽在www.sxpdf.com
2009 年,在苹果公司工作了 4 年半之后, 创业初期,融资困难,马特·罗杰斯从苹果
马特·罗杰斯开始考虑创立一家自己的公 公司“挖来”10 名老同事,让他们免费干
司,做那时还没多少人听说过的智能家居。 了半年的活,而且是一周工作 7 天、每天
他与已于 2008 年离职的前上司托尼·法德 工作超过 12 小时。后来,他又在人才争夺
尔交流了这个想法,但托尼·法德尔却表示, 激烈的硅谷招募到一批有经验、有干劲的
“你知道吗?一个智能的房子实在是太极 精英。不到 30 岁的马特·罗杰斯就这样带
客(Geek)了,没人会喜欢智能家居的, 领着一支平均年龄 40 岁左右的超强团队,
这是一个愚蠢的想法。你要聚焦到一件事 把恒温器做成了一个挂在墙上的 iPhone。
情上,然后把它做到非常好。”[2] 不过,
身为一个货真价实的极客,托尼·法德尔 与大多数都装在白色方盒子里、满是各种
自己却置办了一整套智能家居设备,从太 按键的传统恒温器不同,Nest 恒温器不再
阳能电池板到地源热泵。可是,他发现自 需要“按 15 次按钮才只能调整一下日期”
己没有找到足够好的自动恒温器。 而且“永不更新”。Nest 恒温器只有一个
覆盖在玻璃面板下面的触控式液晶屏以及
那时,房屋的自动恒温器本质上还是一个
卖给建筑商而不是普通消费者的工业产
品。托尼·法德尔曾形容,它们就像 iMac
之前的计算机一样,手动、毫无设计感,
而且几十年没有更新过。如果可以为全美
家庭节约 10% 的能源消耗,这个市场就有
几十亿美元。这让 26 岁就升到苹果高级经
理 的 马 特·罗 杰 斯 心 动 不 已。 于 是,2010
年春天,马特·罗杰斯从苹果离职,和托尼·
法德尔一起创办了一家苹果风格浓厚的软
硬件结合的创业公司:Nest。而且,和苹
果一样,他们的 Nest 也改变了智能家居行
业的面貌。
052
更多精彩尽在www.sxpdf.com
一个可以旋转的全金属环,来完成所有的 Nest 与谷歌的结合并没有迎来期望中的爆发
复杂而强大的功能。只需非常简单的步骤,
用户就可以完成恒温器的安装,之后大约 程师使 Nest 得以在难度极高的综合性消费
经过两周,它就会通过学习适应用户的能 电子产品的设计制造中取得巨大的成功,
源使用习惯,自动完成对暖气、通风、空 成为全行业注视和效仿的对象。
调等设备的控制,让房屋始终处于用户最
喜欢的恒温状态。当房子里的人全部外出 作为智能家居行业的颠覆者与引领者,他
时,恒温器还会通过探测器发现这件事并 们吸引了众多投资人的目光。从最早的无
主动降低能耗,再在人们回来之前提前做 人投资,直到传言估值已达 8 亿美元。但是,
好准备。此外,恒温器还通过 Wi-Fi 与互 谁都没有想到,与苹果公司风格迥异且一
联网时刻相连,不仅可以根据当地的实时 直是竞争对手的谷歌,在 2014 年突然宣布
天气数据优化温度管理,还能随时进行固 以高到令人咋舌的高价——32 亿美元收购
件的更新,如此一来,Nest 恒温器便可以 Nest,而且,在谷歌体系下,Nest 还将保
在第一时间将工程师们的最新节能算法付
诸应用。强大的功能让 Nest 恒温器超越了
托尼·法德尔设定的单一功能,成为控制
整个智能房屋所有硬件的中枢。通过把“一
件事做到非常好”,马特·罗杰斯实现了
自己“打造一整套智能家居”的初衷。
事实上,在产品带有的浓浓的苹果风格的
背后,马特·罗杰斯整合了最好的工业设
计、最好的硬件与软件工程、最好的服务
以及最好的市场营销,应该说,马特·罗
杰斯把整个公司都打造得很像苹果。与大
多数创业公司只能聚焦于软件开发不同,
马特·罗杰斯和托尼·法德尔有着丰富且顶
级的硬件设计开发经验。这两位前苹果工
053
更多精彩尽在www.sxpdf.com
持独立运作。这是谷歌历史上仅次于摩托 工程师们多点开花,设计出了一系列用户
罗拉的第二大收购案。那时的 Nest 如日中 体验极佳的产品,却都没有获得市场的认
天,谷歌也实力雄厚、雄心勃勃。人们相信, 可。2016 年,托尼·法德尔离开了 Nest,
Nest 会在谷歌的帮助下,依托后者各种强 留下马特·罗杰斯继续负责新产品的开发。
大的资源再上一个新台阶,引领真正智能 有人认为,托尼·法德尔离开的原因是他
家居的大爆发。 引入了许多以前在苹果公司工作的员工,
而苹果的风格与谷歌开放包容、富有试验
然而,完成了这一桩表面看上去非常完美 精神的文化格格不入。也有人认为,是托
的“联姻”之后,Nest 却意外地放缓了前 尼·法德尔的管理方法不合适。但不论原
进的脚步,不仅销量增长远远低于预期, 因为何,可以肯定的是,和苹果同一经营
而且后续产品的推出也乏善可陈。Nest 的 理念的 Nest 与谷歌的整合远未达到完美的
互联家庭
电视、暖气等家用电器将会成为美国普通家庭网络接入设备的新成员。
家用电器
家用计算机及路由器
2010 2014 2018
Nest 曾估计智能家居将显著增长,但其他机构估计的智能家居占全部家用设备的比例显然要小得多(图片来源于 MIT Technology
Review)
054
更多精彩尽在www.sxpdf.com
程度。文化的冲突甚至伴随了产品的冲突: 另外,行业内最受关注的智能家居设备已
Nest 恒温器以及其他产品与谷歌母公司推 悄然变成亚马逊的 Echo;虽然 Nest 表示
出的 Google Home 有着明显的竞争关系, 它们的产品并不冲突,但 Echo 是 Nest 最
这让 Nest 很难完全享受到谷歌丰富的资 受欢迎的集成设备。
源。尽管 Nest 的业绩依然非常出众,但远
未达到所有人的预期却也是不争的事实。 在经历了外界长期的质疑之后,Nest 终于
在 2017 年决定扩大恒温器以及后来开发的
此外,智能家居市场显然也没有马特·罗 烟雾报警器、摄像机的销售范围,而上一
杰斯估计得那么乐观。有机构研究发现, 次这么做还是在 2014 年。这个带着苹果
全美拥有智能设备的家庭只有 6%,到 2021 基因的字母表(谷歌母公司)旗下公司,
年也不过 15%,远低于行业爆发所需要的 正经历着巨大的危机。一方面,马特·罗
市场容量。 杰斯确实从一个想法开始,通过不懈的努
力改变了整个行业的样貌;但另一方面,
而且,许多购买智能设备的用户也主要考 公司未来的发展甚至生死存亡,都还扑朔
虑的是“好玩儿”,而不是“这是必需品”。 迷离。
参考文献
[1] ROGERS M. From iPod® to thermostat [EB/OL]. https://nest.com/blog/2011/10/27/from-ipod-to-
thermostat/.
[2] BERGSTEIN B. Matt Rogers, 30 The cofounder of Nest, which invented a thermostat that learns
people’s preferences, explains what’s next.[EB/OL]. MIT Technology Review, 2013(2013). https://
www.technologyreview.com/lists/innovators-under-35/2013/inventor/matt-rogers/.
055
更多精彩尽在www.sxpdf.com
让人工智能走进国人的生活
作者:杨一鸣
就远不止“百度人工智能部门的前掌门人”
这个身份这么简单。在自己的整个科研生
涯中,吴恩达使人类在深度学习、在线教
育等领域的实践水平向前迈了一大步。而
这也是他在而立之年就能成功入选“《麻
省理工科技评论》35 位 35 岁以下科技创
新青年”榜单的关键原因。[1]
吴恩达(Andrew Ng) 1976 年,吴恩达出生于英国伦敦,他的父
亲是一名中国香港地区的医生。1992 年,
获奖年份:2008 吴恩达进入新加坡莱佛士书院求学。1997
获奖时年龄:32 年,吴恩达顺利完成了在卡内基梅隆大学
获 奖时职 位:美 国 斯 坦 福 大 学 计算 机 科 学系和电子 的学习,并获得了计算机科学学士学位。
工程系副教授 紧接着,他又在 1998 年获得了麻省理工
获奖理由:吴恩达在人工智能方面所取得的成果,正 学院的硕士学位。2002 年,吴恩达又获得
在改变人们的生活,并在可预见的未来促进人工智 了加州大学伯克利分校博士学位,并从这
能产业的发展。 年起进入斯坦福大学工作。进入高校的首
要任务就是教学。作为一名教师,吴恩达
如今,只要一提到中国的人工智能产业, 在斯坦福大学一直保持着这样一项纪录:
人们马上就会想起吴恩达。的确,这位能 在斯坦福大学 2013 年到 2014 年度秋季学
讲一口流利汉语的华裔科学家,最令国人 期的机器学习课程中,由吴恩达讲授的课
所称道的,就是他在《最强大脑》节目中 程一举吸引了超过 800 名学生选修。而吴
率领百度人工智能产品——小度击败一众 恩达的课程也因此成为斯坦福大学建校以
高手的辉煌战绩。但事实上,吴恩达的成 来,在同一时间内学生选修人数最多的
课程。
056
更多精彩尽在www.sxpdf.com
对于一名身处象牙塔顶端的研究人员来 这个让“网络大脑”认识猫的实验最后成
说,教书育人还只是自己事业的一个方面, 了深度学习行业的经典案例,它被业界称
而判断自己的学术生涯成功与否的关键, 为 Google Cat。如今,彼时由吴恩达主导
还在于科研成果。那么,在科研方面吴恩 的这个谷歌大脑项目,其技术早已被应用
达又有哪些成就呢? 到了安卓操作系统的语音识别功能上。而
吴恩达本人也因为其一手打造并领导的谷
2010 年,已经在斯坦福大学执教 8 年之久 歌深度学习研发团队,在业内享有“谷歌
的吴恩达正式加入了谷歌公司的科研团队 大脑之父”的美誉。
XLab。XLab 在吴恩达加盟之前已先后为谷
歌公司开发出了无人驾驶汽车和谷歌眼镜 放眼今日的世界,中美两国是少数既有
两个著名的项目。在接下来的两年时间里, 决心又有能力,还有相应的大市场发展
吴恩达和谷歌公司的一流工程师们开始合 人工智能产业的国家。美国的人工智能
作,共同打造世界最大的神经网络,该神 固然发展得如火如荼,而在中国,人工
经网络可以通过与人类大脑学习新鲜事物 智能产业同样是一个各路资本竞逐的朝
时一模一样的方法,来认识现实生活中的 阳行业。身处人工智能研究前沿的吴恩
事物。谷歌公司将吴恩达参与的这个项目 达自然不会忽略这个市场规模是美国
定名为“谷歌大脑”。 4 倍 之多的大市场。于是,在完成了谷
歌的人工智能事业之后,前往中国开辟
2012 年 6 月,吴恩达带领多名谷歌科学家, 新的人工智能事业就成为吴恩达的必选
用 16000 台计算机成功地组建了一个模拟 之项。
人类大脑的神经网络。随后,吴恩达的团
队向该网络展现了 1000 万段无规律的、从 2014 年 5 月,吴恩达加盟百度,担任百度
YouTube 上拣选的视频。最终,这个神经网 公司首席科学家一职,全权掌控百度研究
络在没有外界影响的环境下,自主地习得了 院的研发工作,特别是百度大脑(Baidu
关于猫的各种动物特性,并成功地找出了猫 Brain)计划。在吴恩达的领导下,百度公
的图片,实际识别率超过了 81%。 司在人工智能方面获得了长足的发展。
“作为百度公司人工智能战略的首席架构
057
更多精彩尽在www.sxpdf.com
师,我很荣幸可以见证企业在人工智能方 而具体到产品层面,吴恩达为百度公司所
面的快速发展和崛起。”吴恩达曾在一封 研发的人工智能系统——百度大脑则极大
公开信中如此介绍自己在百度的工作。也 地提升了百度公司现有的语音识别水平。
是在他的带领下,百度公司的人工智能研 用吴恩达自己的话说就是:“在百度的语
发团队已扩张到了 1300 人,其中就包括 音识别体系中,我们所取得的突破之一,
300 位百度研究院的成员。 就是通过规模庞大的神经网络,将语音片
段成功地映射到了相关的文本中。”这种
在成功地设计出百度大脑之后,吴恩达便 在语音识别上的突破对于很多特殊用户来
马不停蹄地启动了对该系统的测试工作, 说无疑是一种福音——对于残疾人、儿童
毕竟实践是检验真理的唯一标准。在 2017 和老人来说,用打字的方法与外界进行交
年 1 月播放的《最强大脑》节目中,吴恩 流有时并不是一件容易事情。但倘若让这
达所主导的百度人工智能系统在人脸识 些人使用由百度大脑所控制的语音处理系
别、跨年龄识别等环节,以 32 的比分险 统,那么交流沟通对于他们来说就是一件
胜《最强大脑》名人堂轮值主席、号称“国 非常方便的事情。而如果心智健全的普通
际记忆大师”的王峰。通过这次胜利,吴 人使用这种智能语音系统,那么无论是学
恩达不仅向世人证明了百度大脑的实力, 习、工作还是娱乐,他们的生活效率同样
同时也让中国人见证了人工智能在未来的 可以成倍提高。
应用潜力。
单从技术的角度来审视吴恩达的智能语音
吴恩达认为,人工智能的首要意义在于能 系统,人们同样可以看到他在相关技术上
够将人类从很多重复性的工作中解脱出 的突破——吴恩达将百度语音系统的识别
来,从而腾出更多时间来做有意义的事情。 率由 95% 提高到了 99%。尽管百度智能语
谷歌大脑和百度小度的面世,意味着人工 音系统的识别率仅仅增加了 4 个百分点,
智能已经发展到全新的层级。吴恩达相信, 但就是这 4 个百分点的微小进步却足以改
在不远的将来,人工智能将像一个多世纪 变语音识别领域的游戏规则。
前发明的交流电一样,给整个社会带来颠
覆性的改变。 受到准确性的限制,当前的语音交互系统
只在少数人的手机上偶尔使用,但如果
058
更多精彩尽在www.sxpdf.com
将吴恩达为百度打造的智能语音系统投入 助手的百度用户规模已经扩张到了该产品
商业应用,那么语音交互就会像现在的手 刚问世时的 3 倍。而随着语音识别技术的
机一样,成为人们在日常生活中必不可少 迭代和进化,其可靠性会越接近采用曲线
的 一 部 分。2015 年, 使 用 百 度 智 能 语 音 (Adoption Curve)。在未来,人们不假思
059
更多精彩尽在www.sxpdf.com
索地以语音的方式与计算机、手机等智能 门高品质的课程及讲师资源,还能根据固
终端进行交流将变为常态。 定的放送时间、课程周期来有序地安排自
己的学业。
如今,人工智能技术已经开始走进了我们
的 生 活。 每 天, 人 工 智 能 所 支 持 的 服 务 与 此 同 时, 用 户 在 每 一 个 周 末 都 要 向
都会惠及百度公司上亿的用户。在搜索、 Coursera 交 作 业, 而 这 些 上 交 的 作 业 基
广告、在线地图、外卖、安全以及消费金 本上都会在第一时间得到计算机的自动
融 等 百 度 现 有 的 业 务 中, 人 工 智 能 技 术 评分。当用户在学期内学习完全部的课
已 经 占 据 主 导 地 位。 而 在 无 人 驾 驶、 语 程、完成了作业并获得了良好的成绩时,
音 交 互、 人 脸 识 别 等 新 业 务 方 面, 研 究 Coursera 才会准许其毕业,并授予其相关
人 工 智 能 的 团 队 也 开 始 逐 渐 发 力。 预 计 的学位证书。
到 2020 年,人工智能产业将成为我国国民
经济的重要增长点,而人工智能产业的市 在 Coursera 的教学环境中,学生的听课环
场总规模也将超过 1500 亿元,由人工智 节只需在网络上即可实现,再也不用通过
能所带动的相关产业规模更会达到万亿元 长途跋涉来完成。而教室的作用则更多地
规模。 体现在其平台功能上,在教室中,学生可
以直接和自己的好友共同讨论自己在线学
接连在谷歌和百度这两家公司取得了科研 习中产生的疑问。当好友也解答不了自己
方面的突破性进展,吴恩达可以说就此奠 的疑问时,学生还可以向教授提问。
定了自己在人工智能领域的学术地位。然
而,他的人生还远远没有止步于科研方面, 在这种情况下,教育资源能够以几何级数
在教育领域,吴恩达的表现也可圈可点。 般的速度流通,而学生的学习时间和空间
其中最著名的要数其在 2012 年和达芙妮·科 也能够获得解放。教授不需要再向学生讲
勒 (Daphne Koller) 教授联合建立的大型公 解重复的课程内容,可以将更多的精力投
开课网络教育平台——Coursera。有别于 入到和学生开展个性化的交流方面;学生
一般的网络教育平台,在 Coursera 上用户 也不再会受到时间和地域的限制,继而可
不仅可以找到来自斯坦福大学、普林斯顿 以在最短的时间内享受最好的教育。
大学、哥伦比亚大学等一流学府的 200 多
060
更多精彩尽在www.sxpdf.com
在吴恩达看来,全面教育的实现,在未来 Coursera 这样的平台免费接受一流的教育。
将 不 再 是 一 个 理 想 国 式 的 幻 想。 未 来, 届时,每一名个体都有机会通过学习最前
身处全世界任何角落的人都可以通过 沿的知识,为他们自己、他们的家庭以及
他们所处的社会创造美好和价值。
参考文献
[1] Home - Andrew Ng[EB/OL].[2017-08-01].http://www.andrewng.org/about/.
061
更多精彩尽在www.sxpdf.com
语音安防的守夜人
作者:杨一鸣
维杰·巴拉苏巴拉曼尼晏 的声音组成的,完全能够由电子技术合成,
(Vijay Balasubramaniyan) 而如今的变声科技已经可以做到以假乱真
的水平了。这也给电话诈骗带来了新的“生
获奖年份:2013 机”,一小段录音或者数字合成的声音就
获奖时年龄:33 能成为威胁极大的电话诈骗。据统计,从
获奖时职位:Pindrop 安全公司联合创始人及首席 2013 年到 2016 年,诈骗电话的频率已经从
执行官 每 2900 通中有 1 通极速增长为每 937 通中
获奖理由:语音交互系统以及变声科技的蓬勃发展 有 1 通,而每个月美国的消费者都能接到
都给电话及语音诈骗带来了新的“机遇”,能否正确 超过 8500 万通诈骗电话。电话诈骗已经对
及时地识别伪造的声音也成了信息安全的主题之一。 语音授权以及信息安全造成极大的威胁,
维杰·巴拉苏巴拉曼尼晏创立的 Pindrop 安
手机通话现在几乎成为我们日常通信的主 全公司正是在这样的背景下逐渐兴起,成
要手段,不过我们有没有想过在手机另一 为如今语音安全防护领域的先驱。
端的那个人是否真的是我们所听见的那个
人呢?从古时候的口技到如今的数字合成 维杰·巴拉苏巴拉曼尼晏出生于印度,和
声音,声音的模仿似乎一直都不是难事。 大多数印度人一样,他的天赋也是软件和
其实从理论上来说,我们的声音从频率的 编程。维杰·巴拉苏巴拉曼尼晏如今已经
角度来看就是一段段频谱,是由不同频率 37 岁,是一位资深的软件工程师,本科
就读于印度本土名校 Rashtreeya Vidyalaya
College of Engineering, Bangalore(RVCE),
主修计算机科学。维杰·巴拉苏巴拉曼尼
晏 2002 年本科毕业后,在西门子等公司
任职软件工程师。2005 年,维杰·巴拉苏
巴拉曼尼晏来到美国佐治亚理工大学攻读
博士学位,选择的研究方向仍然是计算机
062
更多精彩尽在www.sxpdf.com
科学。他十分明智地选择了信息安全,专 话的安全等级进行评级。维杰·巴拉苏巴
注于解决通信系统中有用和无用信息的分 拉曼尼晏指出,声音的频率或者音色并不
流,并致力将此应用于解决实际问题。读 是我们发出声音的全部,在电话通信中,
博的 6 年,是理论和实践结合的 6 年,在 也存在和指纹识别一样的识别点,它们可
此期间,他曾在 IBM 以及谷歌等公司实习, 以是我们的说话方式、通话的地点等,甚
曾负责开发过滤推特(Twitter)中的非法 至通话过程中的噪声都能帮助我们辨别诈
消息的软件系统。2011 年,维杰·巴拉苏 骗电话。其实就和大多数识别技术一样,
巴拉曼尼晏终于博士毕业,他看准了时机, Pindrop 的产品利用算法将通话过程中的识
直接将自己的博士课题以及研究经验拓展 别点数字化,并同步进行分析。通话识别
到实际应用中,创立了 Pindrop 安全公司, 点的数量其实比最精确的虹膜识别的识别
旨在帮助企业和个人不受手机诈骗的侵 点还多,有 147 个。它们能定义通话人是谁、
害。维杰·巴拉苏巴拉曼尼晏表示,现在 在什么地方以及是否是一段录音等识别技
的电话授权一般都是在银行或者企业与其 术中的问题。盛行的互联网通信工具,如
客户之间的通话中完成的,这个通话过程 Skype、微信电话以及谷歌语音等,其通话
就是一个人与人识别的过程,这显然会给 的过程都是将对话分解成一份一份的音频
不法分子可乘之机。“母亲的姓”一直是 包,然后依次传输。Pindrop 产品的算法在
银行验证用户身份常用的个人信息问题, 每个音频包传输的间隙对声音进行识别,
如果不法分子正好在几千次试验中答对了 处理时间往往在 30 毫秒以下,而这正是音
这道题,他获得的收益将是巨大的,而他 频包的传输周期。通过识别 147 个识别点,
们的犯罪成本也只是区区的几分钟时间和 Pindrop 的产品能够采用计算算法为其客户
一部电话而已。维杰·巴拉苏巴拉曼尼晏 生成每一通电话的警报等级,让客户很直
创立 Pindrop 的目的就是要改变这样的状 观地看到通话是否可靠,并对有可能是诈
况——在电话授权中加入非人的一方—— 骗电话的通话者小心提防。[1]
利用数据处理和声音识别保障用户的信息
安全。 值得一提的是,通话的地点也是电话通信
的重要识别点之一,如果通话发生在通话
Pindrop 安全公司的核心技术就是声音指 人不经常出现的地点,那么此通话很有可
纹技术,即利用通话过程中的识别点对通 能是一通诈骗电话。我们需要做的就是从
063
更多精彩尽在www.sxpdf.com
电话的信号逆搜寻地址,找到手机附近的 功能将越来越强大,能够处理复杂业务,
基站或者固定电话的线路,就能知道通话 诸如语音识别登录、语音授权交易等功能
的地点。不过,这种方法对网络电话却是 即将上线。而这就需要安全级别更高的语
束手无策,网络电话的地址伪造起来十分 音识别,当人们故意变声或者播放他人录
轻松。但是,维杰·巴拉苏巴拉曼尼晏和 音以获得登录或者授权时,系统必须能识
Pindrop 还有绝招,他们认为无论坏人采 别出来。因此,Pindrop 正在积极地和美
取什么样的手段隐藏自己的地址,通话的 国前十大银行中的八家以及前五大保险公
质量以及通话过程中的噪声都不会骗人。 司中的两家合作,共同开发高安全级别的
通话质量会受到通话网络以及传输线路的 语音识别系统。这样的系统一旦上线,维
影响,都有着自己的特征,就像在 Hi-Fi 杰·巴拉苏巴拉曼尼晏和他的 Pindrop 就将
发烧友面前不同水电站发出来的电带动耳 改变物联网的支付形式和用户登录形式。[2]
机发出来的声音是不同的。维杰·巴拉苏
巴拉曼尼晏和 Pindrop 通过分析成百上千 Pindrop 根据识别出的诈骗电话建立了世
的通话,建立了通话记录数据库,并以此 界最大的语音欺诈者数据库,这里记录了
来分辨电话的来源。他们如今能十分轻松 试图进行电话诈骗犯罪的犯罪嫌疑人的声
地分辨出一通电话是来自印度还是来自美 音。现在,Pindrop 的系统每天收到大约 9
国。这使得公司可以在接到陌生特征的电 万次诈骗电话,通过对比数据库,Pindrop
话时提醒其客户,例如,注册到美国手机 的系统能够将新数据吸收,并针对诈骗电
运营商的号码实际上可能是通过 Skype 或 话回复“我听不清楚”“再说一遍”等信息,
尼日利亚的网络拨电话。 以此来获得更长的通话时间以及识别电话
诈骗犯罪嫌疑人的时间。和电影中警方试
除了保障电话端的安全,Pindrop 的业务 图在受害人与绑匪通话中定位绑匪的地点
还拓展到了日益增多的语音接口端。如今 一样,多一秒的通话时间,Pindrop 的系统
我们生活中的语音接口越来越多,手机、 就多一分可能将电话诈骗识别出来。[3]
智能手表、智能家居,还有像苹果 Siri 和
Google Assistant 这样的语音助手,它们都 除了开发技术,维杰·巴拉苏巴拉曼尼晏
能识别用户的声音,有些还能与我们进行 的经营能力也有目共睹。博士刚毕业他就
互动。在不久的将来,语音接口的应用和 拉着课题组的同事、教授一起创立公司,
064
更多精彩尽在www.sxpdf.com
并任首席执行官。开创的方向也十分正确, 场上。
正好符合时代发展和少数人涉足的蓝海。 如今,Pindrop 实验室已经分析了超过 3.6
Pindrop 到今天已经走过了 6 年的时间, 亿通电话,而这个数字还在以 1 个 / 秒的
期间凭借自己的声音指纹技术获奖无数, 速度持续增长。“Pin”意为大头针,“Drop”
意为掉落,这两个词连起来,就是“大头
也受到很多投资人的青睐,也不得不说维 针掉地上的声音”。Pindrop 正是将手机
杰·巴拉苏巴拉曼尼晏的吸金能力超群。 通话中的方方面面都考虑进来,作为手机
虽然 Pindrop 在种子期仅仅获得 100 万美 通话的声音指纹,用来评判声音的真伪。
元 的 融 资, 但 在 2013 年, 维杰·巴拉苏 选好方向,将技术做到极致就是成功,维
巴拉曼尼晏将 Pindrop 带到了金融界,立 杰·巴拉苏巴拉曼尼晏的经历完美地诠释
即获得 1100 万美元融资,第二年又获得 了这一点。在手机通信的夜幕中,我们并
3500 万美元融资,更在 2016 年获得 7500 没有踽踽独行,还有维杰·巴拉苏巴拉曼
万美元融资,总计 1.22 亿美元。有了这 尼晏和他的 Pindrop 在为我们守望着。
么多钱,维杰·巴拉苏巴拉曼尼晏也不闲
着,除了瞄准语音接口方向的应用,他还
把 Pindrop 带到了防范跨国电话诈骗的战
参考文献
[1] Gupta P, Srinivasan B, Balasubramaniyan V, et al. Phoneypot: Data-driven
understanding of telephony threats[C].Network and Distributed System Security Symposium. 2015.
[2] BALASUBRAMANIYAN V. Voice is the next interface[EB/OL]. http://www.linkedin.com/
pulse/voice-next-interface-vijay-balasubramaniyan.
[3] CONOR L M. Determining the origin of a phone call cuts fraud, including identity theft[EB/OL].
https://www.technologyreview.com/lists/innovators-under-35/2013/inventor/vijay-balasubramaniyan/.
065
更多精彩尽在www.sxpdf.com
光影记录的新方式
作者:杨一鸣
只留下没有对好焦的照片和遗憾的叹息。
难道就没有一种能够解决对焦难题的技术
吗? 2002 年开始在斯坦福大学攻读博士
学位的吴义仁,当时也在考虑这个问题。
他的导师马克·拉夫依(Marc Levoy)教授
给他指了一条明路——光场摄影技术。从
此,吴博士就成了光场摄影技术最忠实的
信徒,开始研究这种能够一次性捕捉整个
场景光场信息的摄影技术。
吴义仁(Ren Ng) 吴博士于 1979 年出生在马来西亚,9 岁时
跟随父母移民到了澳大利亚。18 岁以优
获奖年份:2012 异的成绩进入美国斯坦福大学学习,开启
获奖时年龄:32 了他在斯坦福大学 8 年的求学时光。他在
获奖时职位:Lytro 公司联合创始人及首席执行官 斯坦福大学先后获得学士、硕士和博士学
获奖理由:将计算机图形学和光场理论相结合,吴义
仁博士发明了便携式的光场相机,能够实现先拍摄 位,博士课题就是研究“数字光场摄影技
后对焦的神奇操作,这样的技术甚至能颠覆整个摄 术 ”(Digital Light Field Photography),
影行业。 设计便携式光场摄影相机,并开发图像处
理软件优化拍摄的照片。[1] 他的博士论文
大约 200 年前,世界上第一台银版照相机 还获得了 2006 年全美计算机学会最优博
在法国诞生。那时,拍摄一张照片不仅昂 士论文奖,可谓出道即成名。毕业之后,
贵,而且曝光、冲洗照片的流程冗长,几 吴义仁立即创立了 Lytro 公司,开始了消
乎是贵族的特权。200 年后的今天,摄影 费型光场摄影相机的开发,并于 2011 年
已经非常平民化,消费者能够使用卡片机、 推出了公司的第一代产品,名噪一时。大
单反相机以及十分方便的手机,记录下我
们生活中的点点滴滴。有些珍贵的场景总 家都对这种先拍照、后对焦的相机兴致勃
是稍纵即逝,而我们的反应总是慢半拍,
066
更多精彩尽在www.sxpdf.com
勃,它也毫无疑问地得到了投资人的瞩
目,首轮融资高达 5000 万美元,次轮融资
也突破了 4000 万美元。凭借可以改变整
个摄影市场以及人们拍照习惯的能力,光
场摄影技术拿遍了大奖,还跻身“《麻省
理工科技评论》2012 年 10 大全球突破性
技术”。
简单而言,光场摄影技术是一种能够先拍 Moon)教授将光的辐射信息,例如色彩和
摄、后对焦的摄影技术,兴起于 20 世纪 90 亮度,描述成一个确定光线位置和方向的
年代。说起光场,其概念最早由意大利伟 四维函数,即坐标点(x,y,z)和方向矢量,
大的艺术家达·芬奇(Leonardo da Vinci)提 并把这个函数称为光场 [2]。总的来说,光场
出,他在自己的手稿上提到了“光场”这 承载了物体成像的所有信息,既包括光作
个模糊的概念。达·芬奇这样描述道:“空 为波的辐射信息,也包括光传播的方向信
气中充满了物体辐射出来的无数个光的金 息。而捕捉了光场,就捕捉了整个取景框
字塔(Radiant Pyramids),它们相互交织在 里所有的光线信息。
一起。”他认为“光的金字塔”承载了物
体成像的所有信息。两个世纪之后的 1846 从原理上来说,在相机内部,无论是化学
年,法拉第(Michael Faraday)在他给理查·菲 胶卷还是数字感应器,所有的消费型相机
力普斯(Richard Phillips)的信中再一次提起
光场概念,认为光应该被理解为波和场, 067
同时具有波动性和方向性。又过了一个世
纪左右,即 1936 年,苏联科学家亚历山
大·喆舜(Alexander Gershun)在他的论文
中讨论了光在三维空间中的辐射轨迹,并
正式提出了“光场”(原文为俄文 световое
поле)这一名词,并做出了完整的解释。时
间到了 20 世纪 90 年代,帕里·穆恩(Parry
更多精彩尽在www.sxpdf.com
生成照片的方式都是利用一块平板(如胶 博士出马了。他首先开发了一种“傅里叶
片)记录穿过镜头的光线的位置、色彩和 算法”,将图像处理过程简化,从而使得
亮度,并最终生成照片。但是普通相机并 图像处理的速度提升 [3]。然后,他采用微
不能记录整个光场的信息,方向矢量并没 镜头阵列的方式复刻多相机阵列采光,能
有被记录下来,只能记录一个平面的光线 够获得拍摄物体的全部光场信息 [4]。于是,
信息,而这就是焦点所对应的位置。光场 这样一台 iPod nano 大小的 Lytro 初代光场
摄影技术的核心就是要将整个光场记录下 相机诞生了。它的形状就像一个单筒望远
来,包括方向矢量。我们都知道,光线在 镜,能很方便地携带,一头是可触摸的屏
没有阻挡物的时候是沿着直线传播的,那 幕,一头是摄像镜头。用户只需将镜头对
么我们只需要两个点就能确定光线的方 准拍摄物体,就能得到图像。拍摄结束后,
向。最简单的光场摄影技术就是由两个图 用户可以在触摸屏端进行操作,随意点击
像传感器构成的,先拍摄两个焦点位置的 图像中的点就能放大、缩小以及进行对焦
图像,并由软件计算出两个焦点距离内的 处理。而这些也都可以在后期制作的时候
光场信息。但是,这样的计算只有在两个 在计算机端完成。
焦点平面距离很近的情况下才能十分准确。
即使有如此被看好的技术和产品,Lytro 公
吴义仁的导师马克教授就曾经采用 128 台 司的日子也不是很好过。在烧掉 9000 万美
相机阵列方案实现了光场摄影技术。而对 元的投资之后,吴义仁和他的 Lytro 公司
于相机之间的图像信息处理,马克教授和 只推出了两代产品,而且这两代产品的销
他的搭档帕特·汉拉恩(Pat Hanrahan)教 售量并不乐观。吴义仁也引咎辞去了首席
授采用计算机图形学,利用计算机的计算
获得拍摄物体全方位的光场信息。没错,
这样的方案就是从前景到后景都被对了一
次焦,并拍摄了下来,最终的相片就是这
些相片的集合。不过,由于多镜头相机的
尺寸问题和图像处理过慢等问题,这样的
方案显然不可能应用到家用型相机,甚至
在工业上的应用也十分有限。这就轮到吴
068
更多精彩尽在www.sxpdf.com
执行官的职位,退下来专心思考光场相机 件方面来说,图像处理的速度也不够快,
的技术革新;Lytro 公司的产品开发方向也 用户常常等不及快门按下后的时间。吴义
从单纯的光场相机转为与时下火爆的 VR 仁和 Lytro 公司给我们好好上了一堂课,告
应用相结合。吴义仁是一个纯粹的梦想家, 诉我们好技术并不等于好产品,也不等于
好发展。
他笃信的光场摄影技术没准儿真的是未来
如今的吴义仁是加州大学伯克利分校的一
的技术,但如今的硬件和软件都不成熟, 名助理教授。即便不再位居高位,即便公
司的处境岌岌可危,吴义仁仍然没有放弃
没有达到与之相称的程度。从硬件方面来 自己的梦想,没有放弃自己的光场摄影技
说,Lytro 初代光场相机的像素不是很高, 术,他依旧在学校里从事光场摄影技术的
与同时期的单反相机相比就很逊色,甚至 研究。在他的眼中,光场摄影技术就是未来,
就是正确的发展趋势,只是软件和硬件等
比一些智能手机的相机还差。第二代光场 因素制约了它的发展。今后的相机镜头、
相 机 Lytro Illum 采 用 了 4000 万 像 素 镜 头 图像传感器只会越来越好,而图像处理软
和 f/2.0 大光圈来提升照片的质量。但是, 件的功能也会越来越好、处理速度也会越
Lytro Illum 的画质并没有明显的改观,因 来越高,这无疑给光场摄影技术带来了新
为超过一半的有效像素都浪费在多次相片 的活力。虽然现实是残酷的,但梦想还是
存在的,光场摄影技术的黎明也许就在吴
的拼接上了。而为了达到高速的图像处理 博士守望的不远处。
能力,Lytro 的光场相机选用的处理器都是
时下最好的,这也造成 Lytro 光场相机的
售价居高不下。Lytro 初代光场相机售价为
399 美元,Lytro Illum 售价为 1599 美元,一
直都是有价无市,销售量十分惨淡。从软
参考文献
[1] SIMONITE T. By tracking the direction of light, a camera takes pictures that can be refocused on
different objects in a scene[EB/OL]. http://www2.technologyreview.com/tr35/profile.aspx?trid=1290.
[2] 麻省理工科技评论 . 科技之巅:《麻省理工科技评论》50 大全球突破性技术深度剖析 [M]. 北京 : 人民邮电出
版社 ,2016:362-367.
[3] REN N. Fourier slice photography[J]. Acm Transactions on Graphics, 2005, 24(3):735-744.
[4] REN N, Levoy M, Bredif M, et al. Light Field Photography with a Hand-Held Plenopic
Camera[J].Technical Report CTSR 2005-02.
069
更多精彩尽在www.sxpdf.com
创 Entrepre
业
家
梅隆尼·怀斯 帕尔默·拉奇
(Melonee Wise) (Palmer Luckey)
梅隆尼·怀斯参与设计了世界 如果虚拟现实设备的价格
上第一台开源机器人 PR2。 不再让消费者望而却步,
今天,Fetch Robotics 的两款 一切都会水到渠成。
产品 Fetch+Freight 正在重新
定义仓储机器人的工作模式。 巴拉吉·斯里尼瓦桑
(Balaji S. Srinivasan)
迈尔斯·巴尔 扫描准父母的基因以发现遗
(Miles Barr) 传性疾病,可能引爆遗传学
太阳能创业公司首席执行官, 的临床应用。
但他希望你永远也看不到他
的产品。
希瑟·鲍尔曼 马克斯·列夫琴
(Heather Bowerman) (Max Levchin)
由 马 克 斯· 列 夫 琴 创 立 的
借助由希瑟·鲍尔曼所研发的廉 PayPal 平台,极大地方便
价激素检测技术,医疗人员得 了往来于世界各地的每一
以有效应对治疗过程中的性别 位个体,同时也推动了无
差异。 现金社会的提前到来。
用新技术建立企业,让技术的商业价值最大化。他们试图把“颠
覆式创新”变成“颠覆式公司”。
更多精彩尽在www.sxpdf.com
preneurs
梅龙·格里贝茨 凯文·斯特罗姆
(Meron Gribetz) (Kevin Systrom)
一位增强现实梦想家正 Instagram 联合创始人,
尝试着把自己的宏伟愿 专注于图片社交。
景打造成商业现实。
拉里·佩奇
(Larry Page)
基于谷歌这个搜索引擎,拉里·佩奇不仅成功地实现了
不同地域、不同时点的信息联通,还创造了一个囊括物
联网、硬件、虚拟现实乃至新兴产业投资的商业生态,
为互联网的发展营造了更多的可能。从这个意义上讲,
他显然是一位善于构建未来的青年发明家。
更多精彩尽在www.sxpdf.com
新机器人时代的缔造者
作者:许屹然
科幻作品中的智能机器人开始成为大众的
新宠?
梅隆尼·怀斯(Melonee Wise) 原来,那个售价高达 40 万美元的机器人名
叫 PR2[1](Personal Robot 2)。作为世界上
获奖年份:2015 第一台开源机器人,PR2 拥有两只机械操
获奖时年龄:33 作臂,可以像人类的两只手臂一样完成一
获奖时职位:家用机器人公司 Fetch Robotics 创始人 些基本操作。PR2 由美国著名的开源机器
获 奖理由:梅隆尼·怀斯 参 与设 计了世界上第一台 人公司 Willow Garage 于 2010 年研发推出。
开源机器人 PR2。今天,Fetch Robotics 的两款 产 Willow Garage 可以说非常具有传奇色彩,
品 Fetch+Freight 正在重新定义仓储机器人的工作 它的创始人斯科特·哈桑(Scott Hassan)
模式。 是谷歌最初的代码编写者之一;除此之
外,酒店管家机器人公司 Savioke、Suitable
如果在你面前摆有两款功能相近的机器 Technologies 等知名公司的创始人都曾在这
人,其中一款拥有两个机械臂,而另一款 家公司工作过。
只有一个,前者的价格是 40 万美元,后者
的价格却不到 4 万美元,作为消费者的你 为了不让价格成为个人机器人的推广瓶
可能会选择后者。 颈,作为前任 Willow Garage 技术高管的梅
隆尼·怀斯下定决心要让机器人成为每个
究竟是何原因让仅有一臂之差的机器人的 家庭的必备产品。前文提到的那个和 PR2
价格如此悬殊?又是何人让以前只出现在 功能相近、价格却不到 PR2 的十分之一的
独臂机器人,正是梅隆尼·怀斯带领她的
072 团队研发推出的第一款产品。
如今,在梅隆尼·怀斯的个人网站首页上,
更多精彩尽在www.sxpdf.com
她这样介绍自己:“在过去的 17 年中,我 器人系统的开发有着较为丰富的经验。”[2]
一直在设计、构建和开发机器人硬件。在
过去的项目中,我曾为无人驾驶船舶、无人 的确,梅隆尼·怀斯在机械领域的丰富经验
驾驶汽车、个人机器人平台、战斗机平台等 完全是凭借自己一步一个脚印的努力获得
开发算法、软件库和硬件。从这个经验来看, 的。从 8 岁时就独立拼成乐高绘图仪,到
我对机器人技术有着广泛的了解,对复杂机 拿下伊利诺伊大学香槟分校(尼巴纳—尚
正在完成开门和插电工
作的世界上第一台开源
机器人 PR2[3]
佩思分校)机械工程博士学位,从暑期实 2006 年, 博 士 毕 业 的 梅 隆 尼·怀 斯 来 到
习于戴姆勒 - 克莱斯勒等知名企业,到毕 Willow Garage。作为 Willow Garage 招募的
业后来到 Willow Garage,从一名实习生慢慢 第二名员工,刚进公司的她从实习生做起。
成为机器人开发经理,在这 20 多年的学习 两年后,梅隆尼·怀斯已经成为公司的技
和工作生涯中,机器人似乎已经成为梅隆尼· 术骨干,并开始着手为世界上第一款个人
怀斯生命中不可或缺的一部分。 机器人 PR2 编写控制程序。起初,她仅
仅是为机器人的头部和一些应用程序接口
(API)编写云台控制代码。云台是承载
机器人头部摄像机进行水平和垂直两个方
向转动的工作台,用于摄像机与支撑物的
联结。当时她的工作就是让机器人能够准
073
更多精彩尽在www.sxpdf.com
确地到达指定位置。随着 PR2 更多功能的 桑意识到,以家用生活机器人来支持日常
上线,梅隆尼·怀斯也开始为其编写越来 生活的时代还很遥远,于是哈桑决定停止
越复杂的控制软件,并最终将其变为一款 对其投资,并将业务集中到早年从 Willow
功能完备的工作机器人。随后,梅隆尼·怀 Garage 衍生出来的专做远程通信机器人的
斯在 PR2 的基础上又开发出 PR2 Alpha 版 新公司 Suitable Technologies;而 ROS(Robot
本。在该版本中,机器人实现了自主导航, Operating System,机器人操作系统)也衍
并且可以连续开 8 扇门以及将 9 个插头插 生成了一个非营利组织,以此来继续领导
入墙上的电源插座。不过,当时的机器人 社区开发者的发展 [2]。
在性能上仍存在极大的不稳定性,这些开
门以及插电等操作在当时需要一个多小时 在 Willow Garage 宣布倒闭之后,大批的员
才能完成,并且经常容易被突发情况所中 工离开。作为世界上最早的家用机器人研
断,甚至导致任务失败。据梅隆尼·怀斯 发企业,这里曾孕育了全世界最优秀的机
回忆,当时有一件事情令她非常难忘,那 器人研发专家。离开 Willow Garage 后的他
就是每当工程师需要登录到机器人系统中 们很快重整旗鼓,纷纷以早年在老东家那
来监视其运行状况时,就会占用大量的中 里学到的知识和经验创立了自己的机器人
央处理器(CPU)的工作空间,从而导致 公司。湾区最大的机器人企业家团体也就
机器人本身的运行速度骤减。在此之后, 此诞生,从旨在实现人机交互的计算机视
梅隆尼·怀斯带人对 PR2 Alpha 进行了不断 觉、路径规划的基础技术到打造能够完成
的改善,终于在 8 个月后,新版本的 PR2 特定任务的服务机器人等,这背后都有着
Betas 全新上线。这一版本的机器人基本实 Willow Garage 的 影 子。 其 中, 作 为 Willow
现了稳定的任务操作,由梅隆尼·怀斯编 Garage 老前辈的梅隆尼·怀斯,秉承老东
写的改进的内部控制算法,让该机器人在 家的研发理念和技术理想,执意要在个人
识别墙上的电源插头时只需一次扫描就可 机 器 人 领 域 开 创 属 于 自 己 的 一 片 天 地。
完成。
2013 年 1 月, 梅 隆 尼·怀 斯 与 其 他 3 名
然而,高昂的售价注定让 PR2 难以向市场 Willow Garage 前同事合伙成立了机器人公
大规模推广。直到 2013 年,年亏损额高达 司 Unbounded Robotics。 与 在 Willow Garage
2000 万美元的 Willow Garage 让创始人哈 工作时的主要目的是营造一个开源的机器
074
更多精彩尽在www.sxpdf.com
Unbounded Robotics 的 4
名创始人。前排左为梅隆尼·怀
斯 , 中间为他们设计的第一款独
臂个人机器人 URB-1
人的开发氛围不同,此次组建团队,梅隆 也只要 4 万美元 [5]。
尼·怀斯希望将开源机器人尽快推向市场。 凭借这个相对来说物美价廉的研发成果,
有了在 Willow Garage 的多年工作经历的积 梅隆尼·怀斯参加了第一届全美机器人创新
累,8 个月后,Unbounded Robotics 发布了 大赛。在那里,她与其他 15 位同行同台竞技,
它的第一款产品 UBR-1。这款产品与它的 台下的评委大多是来自硅谷的风险投资者。
前辈 PR2 相比,少了一只机械臂,传感器 面对这些潜在投资人,梅隆尼·怀斯向他们
也被尽可能地最小化,同时设计了更易于 详细介绍了公司未来的上市策略、入市壁
制造的零部件,从而使 UBR-1 基本版的售 垒以及对于终端客户的解决方案等。最后
价被控制在 35000 美元;而拥有更好的激 经过专家小组的讨论,Unbounded Robotics
光导航以及更快的处理器的高级版,售价
075
更多精彩尽在www.sxpdf.com
取得最终的胜利;同时,梅隆尼·怀斯也得 侠”,它内置的机器识别、图像处理以及
到了机器人商业评论杂志的专栏采访以及 自主导航技术让它可以轻松按照订单的要
行业知名人士的私人咨询服务。 求将商品从货架上拿下来,并放在 Freight
上,由 Freight 负责货物的运输。这种“灵
然而不幸的是,由于与 Willow Garage 的版 巧取物”+“快速运输”的操作模式重新
权纠纷,这款风靡一时的产品并没能让他 定义了仓储机器人的工作模式,也迅速
们的新公司获得成功。梅隆尼·怀斯在自己 打破了业界对仓储机器人的传统印象。
的网站上写道:“与 Willow Garage 的分拆
协议阻止了我们募集 A 轮资金。Unbounded 很快,这种全新的操作模式也让梅隆尼·怀
Robotics 随后决定不再出售 UBR-1。” 斯收获了资本抛来的橄榄枝。2015 年 5 月,
由软银(So Bank)领投、Shasta Ventures
2014 年,经历了第一次创业挫折后的梅 等 多 家 机 构 跟 投 的 投 资 机 构 为 Fetch
隆尼·怀斯选择东山再起,成立了 Fetch Robotics 注资 2300 万美元,帮助这个只有
Robotics。这一年正值 Kiva 大热,Kiva 是 18 名核心研发人员的新公司扩大研发团队
亚马逊在 2012 年斥资 7.75 亿美元收购 Kiva 以及组建新的销售团队。
Systems 公司后研发出来的仓储机器人项
目。该项目专注于如何利用机器人在仓库 如今,在 Fetch Robotics 官网上,可以看到
里完成网上大量的订单派发工作。不过, 目前公司的主营业务板块主要由自主搬运
在梅隆尼·怀斯心中,Fetch Robotics 不仅 机器人、自主数据收集平台以及开源机器
仅是做能运货的小车,而是做一整套的智 人平台的进一步研究和开发这三大部分组
能仓储机器人。 成。在仓储货物搬运领域,Fetch Robotics
现已推出 Hmishelf 系列和 Freight 系列载货
在 Fetch Robotics 成 立 的 第 二 年, 也 就 是 机器人。其中 Hmishelf 系列为中小型机器
2015 年 4 月,梅隆尼·怀斯就和她的团队公 人,其最大载货量为 75 千克至 80.7 千克,
开发布了两款智能仓储机器人。与 Kiva 不 不同型号的产品有着不同的装载货物尺寸
同的是,这两款机器人是成套出现的。其 和载货量,以满足中小货物配送的需求。
中一款叫 Fetch,另一款叫 Freight。Fetch 同 对于大质量货物,Freight 系列可以达到
样继承了 UBR-1 的风格,也是一名“独臂 1500 千克 [6] 的有效装载能力,就像一个永
076
更多精彩尽在www.sxpdf.com