训练 10 亿张图片:Facebook 新 AI 模型很有可能给计算机视觉带来革命

训练 10 亿张图片:Facebook 新 AI 模型很有可能给计算机视觉带来革命

2021-03-05

2031

IT资讯

3月5日消息 Facebook 的科学研究工作人员发布了一种新的 AI 实体模型,该实体模型能够从在网上一切未标识图象的中学习培训,它是一项提升,虽然该精英团队的科学研究仍处在初期环节,但她们期待给人工智能算法行业产生一次 “改革”。

该实体模型被称作 SEER(SElf-SupERvised),被馈入了 10 亿张公布能用的 Instagram 图象,这种图象未历经手动式标识。可是,即便沒有一般在 AI 优化算法训炼中应用的标识和注解,SEER 仍可以独立地训炼数据,持续开展学习培训,并最后在例如目标检验这类的每日任务上做到最大的精确性。

▲ 照片来源于 Facebook AI

这类被称作自监督学习(self-supervised learning)的方式在 AI 行业早已很完善:它由能够立即从给出信息内容中学习培训的系统软件构成,而无须依靠历经细心标识的数据来教她们怎样实行例如识别照片中的目标或汉语翻译文字这类的每日任务。

自监管式学习培训近期造成了许多关心,由于这代表着必须手工制作标识数据信息的工作中要少很得,这对大部分科学研究工作人员来讲是耗时费力的工作中。不用管理方法数据的另外,自监管实体模型能够解决更高,更多元化的数据。

在一些行业,尤其是自然语言理解解决中,该方式早已获得了提升。在总数愈来愈多的未标识文字上训炼优化算法已使例如话题讨论、翻译机器、自然语言理解逻辑推理等应用软件获得了进度。

反过来,人工智能算法并未彻底进到自监管的学习培训改革。如同 Facebook AI Research 的前端工程师 Priya Gopal 表述的那般,SEER 是该行业的创新。她告知 ZDNet:“与目前的在 ImageNet 数据上训炼的人工智能算法的自监管实体模型对比,SEER 是第一个能够任意训炼互联网技术上图象上的彻底自监管的人工智能算法实体模型。”

ImageNet 是一个规模性数据库查询,包括科学研究工作人员标识的上百万张图片,并向很大的人工智能算法小区对外开放,以推动 AI 的发展趋势。

此项目地数据库查询被 Facebook 的科学研究工作人员作为评定 SEER 特性的标准,她们发觉自监管实体模型在例如低空飞行拍攝、物件检验、切分和图像分类等每日任务上好于全新的监管 AI 系统软件。

Goyal 说:“根据仅对任意图象开展训炼,SEER 好于目前的自监管实体模型。这一结果显示,大家不用像 ImageNet 那样的高宽比优选的数据,对任意图象的自监督学习就可以造成十分高品质的实体模型。”

伴随着自监督学习复杂性的提升,科学研究工作人员的工作中并不是沒有挑戰。在文字层面,AI 实体模型的每日任务是为英语单词授予含意。可是针对图象,该优化算法务必决策每一个清晰度怎样与一个定义相对性应,另外充分考虑其在不一样照片中拍摄手法、主视图和样子的区别。

也就是说,科学研究工作人员必须很多数据信息,而且必须一个可以从这类繁杂的信息内容池里计算出全部很有可能的视觉效果定义。

为了更好地进行此每日任务,Goyal 和她的精英团队从 Facebook AI 在自监督学习中的目前工作上改写了一种新优化算法,称之为 SwAV,该优化算法将表明类似的图象集聚到独立的组里。生物学家还设计方案了卷积网络,也就是一种深度神经网络优化算法,优化算法对人的大脑中神经细胞的联接方式开展模型,依据必要性分派给图象中的不一样目标。

最少可以说,依靠 Instagram 的 10 亿张照片的数据,该系统软件的经营规模非常大。Facebook 的精英团队应用了具备 32GB RAM 的 V100 Nvidia GPU,而且伴随着实体模型规格的提升,务必将实体模型放进能用的 RAM 中。可是 Goyal 表述说,进一步的科学研究将对保证 测算作用融入新系统很有效。

“伴随着我们在愈来愈多的 GPU 上训炼实体模型,这种 GPU 中间的通讯必须迅速开展。能够根据软件开发来处理给出的运行内存和运作時间产生的挑戰 .”她讲。

虽然仍有很多工作中要做,可是,在能够将 SEER 运用于现实世界的测试用例以前,Goyal 觉得不可小看该技术性的危害。她讲:“依靠 SEER,大家现在可以根据很多任意的互联网技术上的图象训炼大中型实体模型,在人工智能算法层面获得更高的发展。”

“这一提升能够完成人工智能算法的自监督学习改革,类似我们在自然语言理解解决文字中所见到的。”

在 Facebook 內部,SEER 可用以各种各样人工智能算法每日任务,从自动生成图象叙述到协助鉴别违背现行政策的內容。在企业外界,该技术性还可用以图象和数据库比较有限的行业,比如医药学显像。

Facebook 的精英团队号召进行大量工作中,以将 SEER 推动到其下一阶段的开发设计。做为科学研究的一部分,该精英团队开发设计了一种根据 PyTorch 的全能型库,用以自监督学习,称之为 VISSL,该库是开源系统的,激励大量的 AI 小区组员对该技术性开展检测。

RIPRO主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
素材库创收网 » 训练 10 亿张图片:Facebook 新 AI 模型很有可能给计算机视觉带来革命

提供最优质的资源集合

立即查看 了解详情