趣闻轶事

趣事网

趣闻趣事

奇闻异事

趣闻网 > 趣闻 > 时事新闻 > >>AI学会视觉推理,“脑补”看不清的物体 | 李佳李飞飞等CVPR论文

AI学会视觉推理,“脑补”看不清的物体 | 李佳李飞飞等CVPR论文

李林 发自 凹非寺

量子位 出品 | 公众号 QbitAI

人类有一种非常强大的能力:脑补。

这张照片在人类眼中,左下角的一小片棕黄黑灰就是一匹活生生的马——这个姿势和场景,当然是骑马啦!

但对于大部分的算法来说,图上有两个人,就是两个人,谁知道左下角那团东西是什么,谁知道他们俩在干~什~么~

一篇新鲜出炉的CVPR 2018论文Iterative Visual Reasoning Beyond Convolutions,就尝试着将人类的“脑补”能力带到算法中。

会脑补的算法

这项研究由卡耐基梅隆大学(CMU)和Google合作完成,作者有Facebook研究员陈鑫磊(论文是他博士毕业前完成的)、Google的李佳和李飞飞、以及陈鑫磊的导师Abhinav Gupta。

他们所研究的“脑补”能力,按论文中比较严谨学术正式的说法,是对空间和语义的视觉推理。有了这种能力,计算机就能在一张图像中准确识别更多的物体。

比如说面对这样一个场景,没有空间语义推理能力的算法只能凭车的形状轮廓来辨认它是小汽车还是大巴,在上面的窗户中,也只能认出没被遮挡的那些。

借助空间推理,和三扇窗户排成一排又被局部遮挡住的那个物体,也会被认作是窗户;借助语义推理,通身黄色上面还带灯牌的大巴,就会被识别成校车;空间和语义推理结合起来,算法就能认出小汽车窗户里那个模模糊糊的影子,其实是个人。

我们来看一看比较具体的例子:

比如上图,深蓝色标注的“鼠标”,就是普通神经网络识别不出来,而这种会脑补的新方法能识别出来的。它在图上很模糊,分辨率非常低,但是可以根据周围的物体推断出来。

根据图中的洗衣机,也可以推断出深蓝色标出的洗涤剂槽。

同样一张图像,会脑补的算法从中认出的物体,就比普通神经网络更多。也就是说,它从图像上框出各个物体并识别出来的能力更好。

论文的极为作者用“框出物体并识别”的区域分类任务,给这种脑补算法跑了个分:

与普通的卷积神经网络相比,这种模型在ADE数据集上,每类平均准确率提升了8.4%,而增加网络深度只能提升1%左右。在COCO数据集上,这种模型能将准确率提升3.7%。

怎么做到的?

他们在普通的卷积神经网络上,加上了一个视觉推理框架,由两个核心模块组成:一个是局部模块,运用空间记忆来存储之前的认识,用卷积神经网络来推理;一个是全局模块,基于图进行推理,将区域和类视为图中的节点,通过在它们之间传递信息来进行推理。

详细来说,全局模块有三个部件,一个以类别为节点的知识图谱,一个以图像中的区域为节点、以区域间的空间关系为边界的区域图,和一个为区域分配类别的分配图。

最终,所有模块每次迭代的预测和注意力机制结合起来,就得出了最终的预测结果。

失败花絮

当然,也有失败的时候。

比如说床头柜上可能会放个遥控器这件事,这个算法就和普通的卷积神经网络一样get不到。

学神(们)

这篇论文的四位作者中,二三作是你们非常熟悉的两位女神李佳和李飞飞啦,现在都在Google的云计算部门。两位的履历和成就,大概也不需要量子位再讲一遍了。

四作Abhinav Gupta是卡耐基梅隆大学计算机系副教授,目前主要在研究如何表征视觉世界、语言和视觉之间、行为与对象之间如何联系等问题。

一作陈鑫磊,是众多同学大概都会很崇拜的学神榜样。

这位小哥哥今年2月在卡耐基梅隆大学(CMU)获得了博士学位,现在是Facebook AI研究院的研究员。在浙江大学读本科的时候,他就已经发表过AAAI、CVPR、CIKM等顶会论文了。

读博期间,他先后在微软研究院、Google VisCAM组和Google Cloud AI团队实习过。

他的博士学位论文Visual Knowledge Learning,研究了图像的背景知识在计算机视觉系统理解图像过程中的重要性。这篇论文比较系统地论述了计算机如何自动化、可扩展地学习显式和隐式视觉知识,以及如怎样运用视觉知识来推理。

来这里,可以系统地膜拜一下学神:http://xinleic.xyz/

最重要的是

论文地址,当然必不可少~https://www.arxiv-vanity.com/papers/1803.11189/

以及小哥哥的博士论文地址:http://xinleic.xyz/papers/thesis.pdf

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

相关阅读:

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻删除,投诉邮箱:599385753@qq.com。
趣闻网娱乐门户:一直以来坚持文明办网,传播健康、娱乐的信息!

文章标签:

专题

1290
刘备

刘备(161年-223年6月10日),字玄德,东汉末年幽州涿郡涿县(今河北省涿州市)人,西汉中山靖王刘胜的后代,三国时期蜀汉开国皇帝、政治家,史家又称他为先主。刘备少年时拜卢植为师,而后参与镇压黄巾起义。先后率军救援北海相孔融、徐州牧陶谦等。陶谦病亡后,将徐州让与刘备。刘备早年颠沛流离,备尝艰辛,投靠过多个诸侯。赤壁之战时,与孙权联盟击败曹操,趁势夺取荆州。而后进取益州。于章武元年(221年)在成都称帝,国号汉,史称蜀或蜀汉。《三国志》评刘备的机权干略不及曹操,但其弘毅宽厚,知人待士,百折不挠,终成帝业。刘备也称自己做事“每与操反,事乃成尔”。

1290
十大将军 中国十大将军排行榜 在中国人民解放军1955年开始的陆海空三军大授衔的总共1614名将帅中,原籍省份人数较多的前10位,我们称之为“十大将军时。

最新趣闻

七万左右买什么车好 最值得入手的3款车
七万左右买什么

虽然轿车和SUV车型一直是市场的主

+244
上海迪士尼禁止自带饮食被告 大三学生表示将斗争到底
上海迪士尼禁止

近日,上海迪士尼禁止自带饮食被

+316
打hpv9价疫苗接种年纪 40岁可以打吗?
打hpv9价疫苗接种

前几天有一个提问问为什么9价疫

+425
萨达姆在监狱中到底过着怎样悲惨的生活?
萨达姆在监狱中

2003年,美英等国以伊拉克藏有大

+381
雷军的成功是因为他的老婆张彤
雷军的成功是因

之前董明珠在一次采访中,曝光了

+1544
ofo员工即将陆续搬离北京总部 深陷资金紧缺多轮裁员困境
ofo员工即将陆续

《财经》获悉,ofo员工即将陆续搬

+287
两位中国公民蒙古旅游失踪 疑似已前往无人区探险
两位中国公民蒙

据中国驻蒙古国大使馆10月31日消

+260
宋喆犯职务侵占罪获刑6年 因其不上诉判决已生效
宋喆犯职务侵占

记者今天从知情人处获悉,因被告

+237
外媒爆料英国女王质疑:暴脾气的查尔斯王子适合做国王吗?
外媒爆料英国女

如今的英国女王,在位时间成为史

+205

风云人物

应采儿
应采儿

应采儿

+430
王允
王允

王允(137年-192年),字子师,太原祁

+124
陈法蓉
陈法蓉

陈法蓉

+171
宫崎骏
宫崎骏

宫崎骏

+340
邝美云
邝美云

邝美云

+419
宋慧乔
宋慧乔

宋慧乔

+195
宋承宪
宋承宪

宋承宪

+139
林允儿
林允儿

林允儿

+165
周润发
周润发

周润发

+160

月度点击排行榜

回到顶部