近日,人工智能(AI)研究领域顶级会议NeurIPS(神经信息处理系统大会)正式在官网公布NeurIPS 2020接收论文表。中科院计算所与阿里安全图灵实验室、鹏城实验室共同完成的《启发式领域适应》(Heuristic Domain Adaptation)获录入选。
如何更好地将AI在某一场景下习得的知识用于不同场景,是“领域适应”致力于解决的问题。论文第一作者、中科院计算所智能信息处理重点实验室视觉信息处理与学习研究组三年级硕士生崔书豪介绍说,研究团队通过将经典的“启发式搜索”思想融入到领域适应问题中,来解决在数据不充分情况下的模型训练问题,进而实现将AI从现有数据学习到的知识迁移到未知场景中。比如,在鉴黄场景下,目前该研究成果技术可直接从电商场景迁移至直播场景中应用。
崔书豪告诉《中国科学报》,与电商场景不同,直播场景不仅有主播等人物,还常常有桌椅家具等繁杂的物品背景,这些差异会导致电商场景下的搜索识别技术迁移应用效果不佳。通过“启发式搜索”思想的融入,研究团队构建了启发式领域适用的基础架构,并通过相似性、独立性、终止点等角度进行约束,使算法模型在相同计算量下,达到最佳效果。
在信息流如潮涌般的今天,内容识别与审核角色的重要性愈发凸显。阿里安全图灵实验室负责人薛晖介绍,阿里安全通过技术研发,不断将内容识别技术产品化,形成云盾内容安全(绿网)解决方案,并将其深入到直播审核等领域。在9月底举行的2020年人工智能开发者大会(AIIA2020)上,绿网内容识别技术海还通过中国信息通信研究院性能评估测试,获得了官方权威证书。
“以深度学习等为代表的人工智能技术,已成为当前安全智能化的重要组成。” 阿里安全图灵实验室资深算法专家华棠表示,风险或违规样本具有收集成本较高、业务存在对抗和变异等特点,这使得传统深度学习模型无以为继,因此研究探索基于小样本和增量学习技术的模型训练与迭代,变得非常重要。
薛晖透露,目前阿里正围绕诸多生活中的内容安全审查需求,研发智能化审查一体的内容识别技术。在阿里发布的新一代安全架构中,“安全运营层”就致力于将这些领先技术能力沉淀为标准体系,最终形成“安全中台”,从而解决数字新基建建设的“安全施工标准”问题。
作为国际公认的顶级会议,NeurIPS代表着当今机器学习人工智能领域的最高水平,主要聚焦于人工智能和自然神经信息处理,具有广泛的国际影响力。今年,第33届NeurIPS会议创纪录接收并审阅了来自全球各国提交的9454篇论文,主题涵盖算法、深度学习、应用、强化学习和规划、神经学和认知科学等,最终仅1900篇论文被收录,录用率仅为20.09%,创历年来接受率最低纪录。(赵广立)