重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类

从阿里云官方获悉,近日,国际权威机器视觉问答榜单VQA Leaderboard出现关键突破,阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。

近10年来,AI技术保持高速发展。然而在视觉问答VQA(Visual Question Answering)这一涉及视觉-文本多模态理解的高阶认知任务上,AI始终未取得超越人类水平的突破。

重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类

自然语言技术与计算机视觉交融,是多模态领域重要的前沿研究方向。其中,VQA是AI领域难度最高的挑战之一,对研发通用AI具有重要意义。

VQA的任务是根据给定图片及自然语言问题,生成正确的自然语言回答。

例如下面这张图,图中玩具人的IP出自哪部电影?AI先提取了问题关键信息——玩具人;再根据常识做出回答——星球大战。

重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类

在首届VQA挑战赛上,AI的最高准确率仅能达到55%。今年8月,达摩院以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。

这是VQA测试以来,AI第一次超过人类水平,是标志性的重大突破。

重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类

米粒
  • 本文由 发表于 2021年8月14日13:30:28
  • 转载请务必保留本文链接:https://www.miliol.org/101977.html
科技

毒性堪比眼镜蛇 乱摸水母会出人命!

抖音之前很流行的“水母手势舞”你会吗?张开手掌再捏住手指向后拉,收回手指,张开手指,你就可以得到一只简略版的水母~ 然而不是所有的水母都这般可爱无害,比如今天的主角&mdash...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: