当前位置:首页 >  科学 >  阿里参加的四项比赛均为视频技术领域,奥斯卡,四项冠军,精准预测目标物体下一帧的位置

阿里参加的四项比赛均为视频技术领域,奥斯卡,四项冠军,精准预测目标物体下一帧的位置

发布时间:2020-06-29 16:31编辑:小狐阅读: 902次 手机阅读

阿里参加的四项比赛均为视频技术领域,奥斯卡,四项冠军,精准预测目标物体下一帧的位置(图1)

CVPR 是 AI 领域规模最大的会议,被誉为计算机视觉领域“奥斯卡”其范围涵盖计算机视觉领域的前瞻学术研究和工业应用,会议的研究成果体现着视觉 AI 领域研究的趋势。由于会议、直播等应用逐渐普及,2020 年顶级科技公司的研究成果逐步从图像延伸到领域,涉及压缩、分割、三维视觉等领域。

据介绍,阿里参加的四项比赛均为技术领域。在 DAVIS 赛中,阿里达摩院团队率先实现突破,力压悉尼科技大学 ReLER 实验室,以 84.1 的分数获得了第一名,比 2019 年第一名的中兴和华中科技大合团队高出 7.4 分。

阿里参加的四项比赛均为视频技术领域,奥斯卡,四项冠军,精准预测目标物体下一帧的位置(图2)

图 阿里 AI 以 84.1 分的成绩斩获 DAVIS 比赛第一名

具体来说,阿里参与的是 DAVIS 半赛道。要求是假设用户不与算法交互以获取分割掩膜,输入值只给出第一帧的正确掩膜,算法需要在后续每一帧中实现对单个或多个目标的分割,也就是要把目标的像素标注出来。

如上图所示,衡量分割准确率有两种标准,分别以 J 和 F 为代号,代表区域相似度(Region Similarity)和轮廓准确度(Contour Accuracy)前者测量正确像素的标注数量,后者测量目标轮廓的分割有多精准。最终成绩是 J 和 F 标准的综合分。

阿里参加的四项比赛均为视频技术领域,奥斯卡,四项冠军,精准预测目标物体下一帧的位置(图3)

图 阿里 AI 可以基于前一帧画面,精准预测目标物体下一帧的位置

作为对比,今年 DAVIS 赛第二名 ReLER 实验室提出的 CFBI + 算法,原本领先基础 STMVOS 算法近 10 分,但阿里团队使用空间约束方法、新型训练策略和微调等技术,将基础算法的表现大幅提高了 12 分,摘下桂冠。

除获得四项比赛冠军,阿里还有 17 篇论文入选 CVPR 2020,其中包括一篇自动驾驶领域的研究成果,该论文提出了一个通用、高性能的自动驾驶检测器,首次实现 3D 物体检测精度与速度的兼得,可以有效提升自动驾驶安全性能。

目前,阿里视觉 AI 技术已在全球率先实现大规模落地。例如,城市大脑、拍立淘、优酷等阿里集团内部业务场景均已大规模使用该技术;阿里 CT 影像 AI 已经服务全球 600 多家医疗机构,疫情期间已完成 50 余万例病例临床诊断。

本文相关词条概念解析:

领域

词语"领域",发音lǐnɡyù,有生物学概念,数学概念等多重意义,一个被动物所占有和保卫的空间,这个空间内含有占有者所需要的各种资源,如食物、巢地和配偶等。占有领域的可以是一个个体、一对配偶、一个家庭或一个动物群。

延伸 · 推荐

现在介绍一下这四项基本原则

科学技术领域分为“基础研究、应用研究、工业技术、生产经验”科学技术领域的基础研究如物理研究,新实验出来的抗氧化铁,可以在各行各业使用。同样,对于人脑识别的的基础研究理论,也可以适用于视觉、语言方面涵盖...

标签:
  • 网友评论

科学本月排行

科学精选