12位专家谈AI:2021 年人工智能发展趋势(上)

作者:俊一(译者)来源:36氪发布时间:2021-01-08

编者按:近年来,人工智能技术突飞猛进,人工智能驱动的系统也在显著改善和提高我们的日常生活效率。这篇由人工智能和深度学习领域全球领先的活动机构RE•WORK发布的文章,原标题是AI Experts Predict 2021 Trends,作者是Nikita Johnson。不久前,该机构采访了人工智能领域的12位专家,并将专家们对2021年行业发展趋势的看法汇总在了这篇文章中。这是文章的上篇,主要介绍的是其中6位专家的见解。

图片来源:RE•WORK

对我们很多人而言,2020年并没有完全如期而至。不过,我们已经挥别了2020年,迎来了2021年!

我们前不久采访了一些人工智能专家,了解了他们对于2021年人工智能领域主要发展趋势的看法。

这些专家主要来自加拿大的蒙特利尔学习算法研究所(MILA)、美国信息技术研究及分析公司高德纳(Gartner)、Facebook、亚马逊旗下人工智能研发部门Alexa AI、美国国家航空航天局(NASA),以及许可式邮件营销服务商Mailchimp等组织和机构。

美国信息技术研究及分析公司高德纳(Gartner)数据科学负责人Andriy Burkov

在经过有用户参与的试验后,虽然一些公司可能会推出家庭和工作之间点对点的无人驾驶通勤服务,但完全自动驾驶的汽车在2021年仍然是“准备好了”的状态。

另外,全自动驾驶卡车将开始在高速公路上完成从海岸一端至海岸另一端的长距离行驶(整个过程可能需要借助人为的远程监控),不过最后一公里的驾驶还是会由安全员直接操控。

基于Transformer的预训练模型,比如GPT-3,会更加擅长假装智能,这一点也会更加让人不安,并且其假装智能的程度,甚至会让一些人认为其已经实现了智能。

美国国家航空航天局(NASA)机器学习负责人、图片分享网站Pinterest技术孵化负责人、《云、移动端和边缘智能设备的实用深度学习》(Practical Deep Learning for Cloud, Mobile, and Edge)一书作者Anirudh Koul

2021年,我十分期待的有两个方面的事物。一个是会变得更大的事物,一个是会变得更小的事物。预测未来的最佳办法就是回首过去(也许可以在过去配置一个长短期记忆网络LSTM)。

两年之内,我们的预训练模型就已经从440MB大小的BERT转变成了350GB大小的GPT-3。我们已经能通过云端租用超级计算机,借助其285000个CPU核和10000个GPU(微软为硅谷大亨联合建立的人工智能非营利组织OpenAI开发的)的计算力。

我们已经实现了在你口袋里的iPhone A14芯片中安装118亿个晶体管。我们已经能够在90秒内训练ImageNet,而十年前,这一训练过程还需要花费数月。

所以,我们可以预见,计算、模型和算法的力量会持续呈指数级别增长,进一步向众人揭示人工智能的新奇魔力。

另一方面,我们现在可以实现BERT精准度,但在使用FastFormers的基础上,CPU推理速度提高了233倍。如今,我们通过NVIDIA Maxine传输视频通话,只需要较之前五百分之一的带宽。我们将训练AutoML模型的时间从GPU运算时长40000小时 (2018年的MNasNet)减少到了3.75小时(2019年的Single-Path NAS)!

单一地关注模型修剪和模型量化,并不是我们对模型的研究主题,而研究主题是实践者已经写好的高效三行代码(TensorFlow模型优化工具箱)。

在2021年,关注小事物的乐趣会持续增长,让使用边缘智能设备的用户获得基于强大模型的神奇体验。

情绪感知初创公司Affectiva联合创始人兼首席执行官Dr. Rana el Kaliouby

我们将看到情绪感知人工智能的新用例,以在新冠疫情大流行期间促进在线协作和交流。

在新冠疫情期间,我们比以往更加依赖视频会议。视频会议将大家虚拟地连接起来,让我们得以远程工作、在家学习并展开社交生活。

然而,目前存在的一个较大问题是:这些技术上,情绪感知是盲区。当我们面对面交流时,我们能够传递的信息不仅来自语言本身,我们还能用面部表情、语音语调以及肢体语言来表达自己。但这些技术的最初设计初衷,却并不是来捕捉我们与周围人互动时的细微差别的。

我们也许可以借助人工智能,来在虚拟环境中保留我们人性的那一面。具体而言,能够根据面部表情和声音理解人类细微情绪和复杂认知状态的情绪感知人工智能软件,可以解决疫情期间已经出现的一些技术短板,我们会看到各大公司将其运用于新的用例,比如:

视频会议和虚拟活动——情绪感知人工智能能够提供对人们在虚拟活动或者会议中的情感解读。它能为线上发言者提供真实的观众反馈,让参与者有一种共同的体验,同时能帮助公司在这段紧张时期了解集体的参与度。

线上学习——情绪感知人工智能能够提供学生对线上教育材料和教学的参与反馈。当学生迷惑、紧张或者乏味时,系统就会发出信号。这在疫情期间尤为重要,毕竟有很多学生在网上学习时,都得了“Zoom疲劳症”。

远程医疗——随着远程就诊逐渐替代面对面诊断,情绪感知人工智能能够在患者和医疗提供者之间建立起更有意义的讨论和信任。此外,对患者情绪健康的数据驱动分析也提供了一种心理健康的量化测评方法,而不是让患者用简单的1至10分来自我评估。

蒙特利尔学习算法研究所(MILA)博士研究员Alexia Jolicoeur-Martineau

降噪得分与退火兰格文采样(DSM-ALS)和扩散去噪的变种将开始打破模型生成的记录;它们将击败目前最顶尖的生成式对抗网络(GANs)。

我们还将看到生成式模型的新指标,因为现在的指标IS(inception score)和FID(Frechet Inception Distance score)将会使值接近完美,但仍未实现真实感图形。

人工智能机构Got-It AI首席科学家兼对话式AI负责人Chandra Khatri

无代码的人工智能平台、产品和初创企业开始激增:在过去几年里,人们创建了很多强大的深度学习和人工智能工具,比如PyTorch和Tensorflow。工程师们现在准备在现有工具之上构建无代码的人工智能平台和产品层,用户只需要简单地提供其数据,并且通过配置或者用户界面列出或选择模型。

我们不仅可以训练和服务模型,而且还可以通过REST API暴露给应用程序。

Got-It AI开发的无代码、自我发掘、自我训练以及自我管理的平台,就在朝着大众化对话式人工智能的方向发展。微软前不久推出的一款名叫“Lobe”的应用程序,可以让所有人都能训练人工智能模型,其也是在朝着大众化对话式人工智能的方向发展。

人工智能促进可持续发展:我们正在经历一个大流行病(包括非典病毒、H1N1病毒和新冠病毒)变得更加普遍的阶段,气候变化也造成了大量森林火灾和物种灭绝,洪水和干旱等问题也变得越来越普遍。

我们将看到,越来越多的初创企业,以及由大公司或组织资助的计划,它们利用人工智能来实现可持续发展。我们已经看到了一些绿色科技初创公司,比如斯洛伐克的可再生能源公司Fuergy和加拿大乘车共享平台Facedrive,我们还可能会看到,人工智能初创公司利用预测模型来应对气候变化、大流行的预测和缓解,以及城市交通问题等等。

蒙特利尔人工智能伦理研究所(MAIEI)创始人兼首席研究员、微软公司机器学习工程师兼创新技术合作事业部(CSE)首席人工智能委员会成员Abhishek Gupta

我的预测(以及我真诚的希望)是,伦理、安全以及包容会成为在人工智能领域工作的每一个人日常工作中遵循的原则。更重要的是,我预测一些像差别隐私这样的概念将更加主流,并且会很好地融入到日常实践中。

随着新的组织开始意识到利用人工智能完成工作的价值,我还预测,在应用人工智能的传统领域之外的地方,也将开始出现大量的能力建设工作。

随着人工智能工具变得更加易于使用,公民数据科学家的概念会获得更多的关注,人工智能技术也将会作为一种新颖的方式,用于解决那些对人类社会具有重要意义的问题。

最后,像信息污染这样的问题将会加剧,我相信这会开创一个知识建设的时代,各组织和团体会努力提高人们的认识,使大众具备更好地驾驭环境的技能。


扫码加蝌蚪五线谱微信