在人工智能兴起的第九年,还有什么可以做的呢?

从2012年开始,人工智能的复兴已经进入第九个年头,人们对“什么是人工智能”的理解已经从最初的无知,渴望和恐惧逐渐转变为深刻的理解。在2018年,人们仍在讨论人工智能何时会再次进入寒冷的冬天,但是在2019年,人们将不再对“寒冷的冬天”感到冷落,而是通常在寻找“如何使人工智能易于理解”或“由AI隐私,安全性和道德问题引起。”

到2020年,人工智能仍将蓬勃发展,并在各行各业中产生深远的影响。到2020年还有10个月的时间,让我们预测一下人工智能的重要趋势是什么? CB洞察力对此问题做出了判断,并给出了九个重要的人工智能研究和应用趋势。人工智能技术评论在一定程度上同意这些判断。对于这9种趋势,我们将进行以下分析。

首先,Deepfake将改变商业模式

CB的见解认为,商业Deepfake可能会崛起,死去的名人将“复活”,零售和营销方式将发生变化。

几天前,Deepfake技术出现在印度的选举中,并被候选人用于竞选活动的拉票材料。尽管该候选人以惨败告终,但这意味着Deepfake点燃的AI变脸之火已逐渐增加。

尽管此技术对政治视频和色情视频有负面影响,但对于媒体和电影公司而言,这是一个千载难逢的机会。例如,好莱坞的一些电影制片厂正在寻找“数字化复活” 1950年代电影角色的方法。

在商业层面,Deepfake将变得更加个性化,改善电子商务体验和虚拟在线试用;广告展示位置也将朝着高度针对性的方向发展,例如根据需要合成视频并配备相应的方言;创作过程也将发生变化。可能必须自动化,例如“化妆”电影续集。

从技术角度来看,Deepfake技术也在迅速发展。就在最近,北京大学和微软研究院分别提出了FaceShifter和Face X-Ray。前者是一种高保真度,遮挡脸部改变的工具,而后者是一种可以检测假脸部图像的工具。训练有素的FaceShifter可以自我监督的方式恢复异常区域,而无需任何人工注释,并且可以自适应地整合身份和面部合成属性。

人脸X射线不仅可以判断它是否是合成图像,还可以指出它在哪里合成,即具有识别和解释功能。

这两种技术被称为AI的“长矛”和“面罩”,并在业界取得了领先的成果。还值得注意的是,它们需要的数据比以前的方法少得多。

因此在Deepfake问题上,2020年的发展趋势主要包括:

1)Deepfake在一项进攻和一项防御的斗争中逐渐得到改善。小数据和无监督的训练方法将成为该模型的主流。传统的费时费力的计算机生成图像技术也将逐渐被取代。

2)Deepfake将改变商业模式,广告营销将变得更加个性化,电影创作将不再局限于真实的拍摄。

黑客的革命:使用AI攻击AI

传统的黑客主要通过发现系统漏洞来渗透系统。但是进入人工智能时代之后,黑客与白人客人之间的攻守战争也发生了巨大变化。

随着人工智能的兴起,人工智能正逐渐用于自动检测和对抗恶意软件。它可以学会检测可疑行为并在可能影响任何系统之前防止网络攻击。同时,它使人类可以避免不必要的工作量。

但是攻击者也可以使用相同的技术来增强其攻击方法,尤其是犯罪分子将其武器化。这些恶意软件甚至可以逃避最佳的网络安全防御并感染计算机网络,甚至可以仅在摄像机上检测目标。攻击他的脸。

这意味着在2020年,未来的黑客可能会以两种方式工作:

1.欺骗的规模上升到系统水平;

2.使用AI发起更复杂的攻击。

例如,在2019年,Skylight Cyber的研究人员找到了一种发现AI模型固有偏差的方法。利用这种偏见可以创建“后门”,使恶意软件绕过AI防火墙并欺骗防病毒软件。

也就是说,如果您能够了解AI模型的工作原理并根据其特定功能设计攻击武器,那么就可以欺骗系统。随着越来越多的AI公司(例如Skylight Cyber),消费者和公司保护水平肯定会提高,但是针对AI特定弱点的新一批黑客和软件也将出现。

另一方面,黑客也可能从数据的角度愚弄AI,即破坏AI算法的训练数据,使AI有偏见,并影响其在网络中正常行为与恶意行为之间的区别。

在人工智能兴起的第九年,还有什么可以做的呢?

使用语音合成的刑事案件随着网络安全研究人员越来越多地使用AI来防御攻击,AI本身也将被用于制造更复杂,更有针对性的网络攻击。例如,Deepfake生成的语音和合成语音变得越来越现实。

在欧洲,有一些黑客利用AI模仿公司CEO打电话给员工,然后转移他们的案例。尽管没有关于使用AI攻击现实世界中的犯罪的报道,但早在2018年,IBM就开发了一种名为Deepeeper的深度学习驱动型恶意软件,该软件可以绕过攻击的网络安全保护。

该软件被描述为“由具有高度针对性和回避性攻击工具的AI驱动的新型恶意软件”,旨在了解现有AI模型如何与恶意软件技术结合以创建新的攻击类型。这项技术将黑匣子AI的传统弱点变成了优势。在目标出现之前,它可以隐藏在普通应用程序软件中,并且如果它感染了数百万个系统,则不会被检测到。

仅当确定某些条件时,此AI模型才会“解锁”并开始进行攻击。当然,除了AI型黑客之外,利用量子计算资源的量子黑客,利用大数据进行分析的大数据黑客等也将逐渐浮出水面。因此,在技术层面,2020年的黑客趋势包括:

1)人工智能本身也将被用来制造更复杂,更有针对性的网络攻击。

2)由于AI的黑匣子性质,网络攻击将变得更加隐蔽和暴力。

第三,人工智能技术日益普及和民用,AutoML将展示其实力

AutoML作为用于自动设计和训练神经网络的一组工具,可以减少企业进入的障碍,并使技术更具“平民性”。从成千上万的特定任务设计或搜索正确的神经网络框架的整个过程非常耗时,尤其是在针对更复杂的场景(例如要求速度和准确性的自动驾驶)设计AI架构时。简单。

作为响应,神经体系结构搜索(NAS)出现了,可以自动为给定任务找到最佳AI设计的过程。 2017年,Google正式将其命名为“ AutoML”。谷歌当时指出,AutoML会激发新的神经网络的诞生,并使非专家能够根据他们的特殊需求创建相应的神经网络。

从那时起,AutoML就得到了越来越广泛的应用,并且在数据设计,训练,模型搜索和功能工程等AI设计中发挥了巨大作用,极大地推动了AI技术的普及。

总体而言,AutoML具有两个主要优点:

1)可以缓解人才短缺的问题:目前AI专家仍然处于非常稀缺的状态,AutoML将大大降低非专家和企业使用技术的门槛,从而促进AI技术的普及和推广。

2)可以节省成本并降低复杂性:即使对于专家而言,设计神经网络也是一个耗时且费力的过程。 AutoML减少了计算和反复试验的成本,同时也开发了更好的解决方案。

随着AI技术变得越来越流行,AutoML将继续展现其实力。在未来的研究方向上,我们可以从算法方向和理论方向入手:

1)在AutoML算法中,如果未来的工作能够在效率提高,泛化,整个过程的优化,面向开放世界,安全性和可解释性的五个方向上取得突破,将会有更大的价值。

2)在对AutoML理论的研究中,目前相关的研究很少,并且自动机器学习的泛化能力和适用性还不是很清楚。因此,一方面,有必要回答当前自动机器学习算法的适用性和泛化能力,另一方面,有必要回答哪些问题类别具有通用机器学习算法的可行性和更广泛的问题自动机器学习算法的空间。

第四,联邦学习将带来新的数据共享范例

联邦学习的概念最早由Blaise等人提出。在2017年Google AI博客上的博客文章中。

自成立以来,相关研究一直在进行。联邦学习能够在如此短的时间内从一个概念迅速转变为一个主题的主要原因是,联邦学习技术作为一种学习范例,可以解决“数据岛”问题,同时确保用户数据的隐私性。

没有数据收集的改进的AI模型与传统的AI模型相比,联合学习更像是人工智能发展面临的困境的新范例,例如:

1.在联邦学习的框架内,每个参与者的地位平等,可以实现公平合作;

2.数据保存在本地,以避免数据泄露,满足用户隐私保护和数据安全的需求;

3.可以确保参与信息和模型参数交换的所有各方都被加密,同时保持独立性;同时,它们可以成长。

4.建模效果与传统深度学习算法没有太大区别;

5.联邦学习是一种闭环学习机制。模型的有效性取决于数据提供者的贡献。以上优点显然提供了解决数据隐私和安全问题的新方法。在特定的应用程序级别,NVIDIA的医疗硬件和软件框架Clara能够支持联邦学习。当前,平台上有来自美国放射学院,MGH和BWH The Science Center和UCLA Health训练相关算法的临床数据。

因此,从技术上可以确保联邦研究合法有效。因此,联邦学习就像一个操作系统。它的特点是多方合作,只有得到许多各方的认可,才能发挥其力量。因此,接下来,联邦学习将继续成为2020年的热门研究趋势:

1)工业领域不仅在医学领域,而且在金融领域,都将加大力度部署联邦学习。下一步,跨领域合作和跨国合作将成为常态。

2)数据隐私和小数据问题已得到缓解,跨设备模型培训已成为解决方案。

五,机器学习加智慧城市建设

对于智慧城市而言,最重要的事情是使用各种信息技术或创新概念来连接和集成城市的系统和服务,以提高资源利用效率。

从技术发展的角度来看,智慧城市的建设要求通过应用新一代信息技术(例如以“移动为代表”的物联网和云计算)来实现全面的感知,无处不在的互连,普适计算和融合应用。技术。”

物联网和机器学习的兴起为它提供了明确的支持,例如使用机器学习对通勤行为进行建模并关注影响通勤方法选择的因素;使用机器学习来分析传感器数据,以减少温室气体排放和更智能的资源管理。

当然,智慧城市涉及广泛的领域,绝不是要掌握的公司。甚至是价值数万亿美元的Al巨人Alphabet也只能通过与政府联手规划房地产,公共能源设施,交通和其他布局,在许多城市中创建新的社区。

例如,在去年第二季度,Alphabet的子公司Sidewalk Labs发布了一份长达1500页的提案,详细介绍了如何通过与政府和其他企业的合作,以13亿加元在多伦多建设智慧城市。

该项目的重点和重点是将人工智能应用于政府和城市规划中。总而言之,到2020年,智慧城市的发展将在合作和技术上蓬勃发展:

1)在合作层面,必须得到政府的青睐,政府的参与将削弱企业不成比例的前期创新成本。

2)在技术层面,必须优化端到端解决方案。拥有机器学习城市开发工具,自动驾驶技术和建筑能源管理的AI公司将极具竞争力。

六,利用AI技术应对AI培训的大量消耗

计算密集型AI技术不仅需要更智能和可持续的解决方案,而且还应有助于满足全球不断增长的能源需求。

人工智能领域的进步通常是自上而下的,例如,一些人工智能工具是由技术巨头开发的,然后开源给其他人。造成这种现象的原因之一是AI研究的计算强度。

根据统计数据,Google在2018年BigGAN实验中用于创建狗,蝴蝶和汉堡的超现实图像的功率“等于过去六个月中每个美国家庭使用的总电量”。这样的功耗真是令人震惊!

随着AI能耗的持续增长,节能将成为2020年及以后AI的重要研究课题。人工智能技术主要有三种节省能源的方法:

1)硬件公司将专注于提供用于机器学习研究的“超低功耗”设备,而能源效率将成为边缘计算的主要考虑因素。

2)将AI应用于公用事业规模的能源生产:越来越多的云计算巨头将转向使用可持续能源和使用AI技术来增加可再生能源的输出并简化数据中心的运营。

3)简化发电和油气领域的业务:人工智能可以预测可再生能源的输出,实现网格管理的自动化,帮助油井的精确钻探,并为智能家居和商业建筑提供可持续的能源管理解决方案。

七,当务之急是解决小数据问题

如果没有足够的数据来训练“渴望数据的”深度学习算法,则有两种解决方案:生成合成数据,或开发可以从小数据中学习的AI模型。产生合成数据的方法被广泛地用于自动驾驶领域,即,合成在现实世界中难以获得的图像数据,例如暴风雪和模拟环境中的异常行人行为。

开发可以从小数据中学习的AI模型方法。该特定方法通常用于计算机视觉任务的转移学习,即在具有大量标准数据的任务上训练AI算法,然后将算法学习到的知识转移到另一数据中。在更少的任务上。尽管迁移学习在计算机视觉任务中起着很大的作用,但由于缺少标签数据,因此在NLP任务中,该方法尚未取得良好的效果。

另一种方法是自我监督的预训练,可以更好地处理NLP领域的特殊性。谷歌的BERT是自我监督预训练的一个很好的例子,因此AI语言模型不仅可以基于先前的单词来预测单词,而且还可以预测随后的单词,从而可以实现对语言的双向理解上下文。

由Yann LeCun领导的Facebook人工智能部门一直在进行自我监督。一个示例是预先训练一种语言模型,然后对模型进行微调以应用于识别仇恨言论。

在解决小数据问题方面,2020年的发展趋势主要包括:

1)随着自我监督技术的发展,自然语言处理领域将再次成为人们关注的焦点。下游NLP应用程序(如聊天机器人,机器翻译和类似人类的文字)将蓬勃发展。

2)大型科技公司仍将引领技术发展。预训练语言模型的开发也需要大量计算。因此,小数据AI模型的开发也将遵循“自下而上”的规则,也就是说,技术巨头将向下游应用程序的研究人员开放源代码开发结果。

3)生成真实和虚假数据的综合数据方法和工具将为那些没有大量数据的小型公司(如大型公司)提供更公平的竞争环境。

八,量子机器学习

结合了经典机器学习算法和量子AI的混合模型将在不久的将来实际应用。量子机器学习借鉴了传统机器学习的原理,但是算法在量子处理器上运行,不仅比普通的神经网络更快,而且还克服了阻碍人工智能研究大量数据的硬件限制。

技术巨头和量子初创公司都在研究这种混合方法,其中部分任务由运行在普通计算机上的传统神经网络执行,部分任务由量子神经网络(QNN)增强。

例如,自2013年以来,Google AI团队一直在尝试开发用于量子计算机的算法,最近的目标是在现有的量子设备上开发混合量子经典机器学习技术。

他们坚信,尽管当前对量子神经网络的研究只是理论上的,但在不久的将来,理论体系将在量子计算机上得以实现和验证。 2020年,量子机器学习中可以尝试的方向是:

1)针对世界上最强大的两种计算范例,量子计算和人工智能,我们最初可以尝试与经典计算机合作以解决现实世界中的问题;

2)量子云计算将成为云计算战场的前线。亚马逊,谷歌,IBM和微软等公司将增加对量子云计算的投资。同时,量子计算将与传统的GPU和CPU协作以增加云。计算的增加值。

九,从自然语言处理概念中学习以了解生活

实际上,自然语言处理和基因组都是由序列数据组成的。人工智能算法非常适合自然语言处理领域,还将展示其在基因领域的技能。

在自然语言处理中的自我监督学习中,人工智能算法可以预测句子中丢失的单词,就像句子是多个单词的序列,蛋白质是特定顺序的氨基酸序列一样。 Facebook AI研究所和纽约大学的研究人员已将相同的自我监督学习原理应用于蛋白质序列数据。

与NLP不同,它使用自我监督学习来预测缺失的单词,而在蛋白质序列数据上,AI需要预测缺失或隐藏的氨基酸。

DeepMind在基因组方面取得的进展是最受关注的最新进展之一。他们已经开发出一种称为Alphafold的算法,该算法可以理解基因组蛋白质折叠中最复杂的困难之一,并最终确定蛋白质的3D。建筑。

Alphafold实际上借用了自然语言处理的概念来预测氨基酸之间的距离和角度。在从自然语言处理的概念中学习以了解活体方面,未来可能的方向是:

1)更好的药物设计:现在有些药物靶向蛋白质,但是蛋白质会随着环境的变化而动态变化,因此了解蛋白质的结构及其折叠方式将更好地开发此类药物。

2)AI算法有助于对蛋白质进行建模并了解其结构,而无需深入了解该域。

3)将有可能针对医学和材料科学领域的特定功能开发和优化新的蛋白质设计。

芯时代

«   2020年5月   »
123
45678910
11121314151617
18192021222324
25262728293031
网站分类
控制面板
您好,欢迎到访网站!
  查看权限
友情链接

Powered By Z-BlogPHP 1.6.0 Valyria

Copyright © 有福网http://youfu.org