不久前,谷歌公布未来人工智能新布局,整合之前零散分布并各自独立于云计算业务部的各个机器学习团队,成立了新组织,并任命一位华人女性为新组织的首席科学家。消息一出,令业界震惊又兴奋。
这位科学家名叫李飞飞,是当今站在金字塔顶端的科学家之一。她36岁就成为斯坦福大学终身教授,任斯坦福人工智能实验室和视觉实验室的主任。她倡导的 ImageNet 竞赛,每年都牵动着整个业界的心弦。她的高质量论文,在顶级期刊发表超过100篇,被引用高达4万余次。她入选“世界百大思想者”,被评为美国“年度杰出移民”之一(爱因斯坦、基辛格也曾获此殊荣)。
英语关过不了,无法从事类似于国内的好工作。迫于生计,父亲成了照相机修理工,母亲成了超市收银员,勉强维持温饱。因此除了上学,她还要尽可能补贴家用,课余时间去中餐馆、洗衣店打零工,去别人家打扫房子。打工和上学就成了她适应美国新生活的全部内容,最辛苦时一天睡不到4小时。图片里包含的内容。比如让计算机认猫,那么首先告诉计算机,猫是圆脸、胖身子、两只尖耳朵和一条长尾巴构成的东西。然而现实生活中,单单猫的品种就有成千上万,就算同一只猫,也可能摆出上百种不同姿势。如果遇到一些骨骼清奇的猫,换个姿势可能计算机就傻眼了。当时,图像识别技术已发展了20个年头,但计算机能够识别的物体也不过十几种。大千世界何其多样,区区这几种物品远远不够。坚守不懈,成就梦想
面对图像识别如此匮乏的“词汇量”,李飞飞却有疯狂的想法。她不仅毫不退缩,还“异想天开”拿出字典,要让图像识别涵盖到字典里每一个词条!
最终确定的方法很原始也很简单,就是像人类婴儿识别猫那样。人类的眼睛就像一架生物照相机,每200毫秒就能获取一幅图片。婴儿从未被灌输猫的特征,却能很快认出猫,无论什么品种什么姿势。
因此李飞飞开始训练计算机,让它看更多图片。2007年起她在网上下载了近10亿幅图片,然后给它们分类、打标签,建立题库为计算机看图训练而用。由于工作量太大,几个月后研究经费几乎用光,而且照此进度需十几年才能完成建立题库的目标。在最困难时,李飞飞想过重操旧业开干洗店筹集经费,但从未想过放弃。
当大家一筹莫展时,美国最大电商亚马逊的众包平台帮了大忙。通过众包平台,李飞飞在网上雇佣了167个国家共计5万人,给10亿张图片筛选、排序、打标签。2009年时题库就包含了1500万张图片,涵盖2万多种物品。最后,这个题库发展成今天大名鼎鼎的ImageNet数据库。
更可贵的是,ImageNet如此庞大的图片数据是免费的。它向全球开放,所有致力于计算机视觉识别技术的团队,都能从它里面直接拿“试题”,训练自家识别技术的准确率。如今计算机识别的错误率已经从28%降到3.6%,比人眼识别错误率5.1%还要低。这都要归功于ImageNet数据库以及李飞飞团队的努力。
梦想点亮未来
计算机图像识别,是人工智能领域至关重要的技术,也因此“李飞飞”这三个字如今是AI界无人不晓的名字。
计算机的图像识别目前还只是用于识别衣服品牌和人脸,只能给人类一点辅助性帮助,而未来计算机将学会如何理解图片,即自行学习,能像真正的人类一样去看待世界。届时,计算机将赋予视觉智能,为后世子孙创造更美好的未来。
所有这些AI研究,都是为了最终服务于人类,就需要学术和产业有效结合。为拉近AI研究与人类日常生活的距离,也为了使AI更接地气,或许就是因此李飞飞走出实验室加入了谷歌。
现在,这位图像识别领域的领军人、人工智能顶峰的科学家、美貌与智慧并存的华裔奇女子,执掌了世界上最负盛名的谷歌AI产业,她会带来什么样的AI前景,又会把人类带到什么样的未知领域?我们翘首以待吧。
相关阅读:
文章标签:
刘备(161年-223年6月10日),字玄德,东汉末年幽州涿郡涿县(今河北省涿州市)人,西汉中山靖王刘胜的后代,三国时期蜀汉开国皇帝、政治家,史家又称他为先主。刘备少年时拜卢植为师,而后参与镇压黄巾起义。先后率军救援北海相孔融、徐州牧陶谦等。陶谦病亡后,将徐州让与刘备。刘备早年颠沛流离,备尝艰辛,投靠过多个诸侯。赤壁之战时,与孙权联盟击败曹操,趁势夺取荆州。而后进取益州。于章武元年(221年)在成都称帝,国号汉,史称蜀或蜀汉。《三国志》评刘备的机权干略不及曹操,但其弘毅宽厚,知人待士,百折不挠,终成帝业。刘备也称自己做事“每与操反,事乃成尔”。