近十年来最引人关注的人工智能领域突破性成就,大都是以人工神经网络为技术核心,而其代表则为数据驱动的深度学习以及机器学习。过去的2020年,或许是市场检验数据驱动人工智能能耐的关键年份。
迄今为止,数据驱动人工智能所展现的乐观发展有:
1.论证小数据样本学习(low-data training / small data training)成效的论文开始引发关注。这包括“一次或几次性学习”(One or few shot learning),甚至是“少于一次的学习”(Less than one shot learning)的科研成果。这些技术旨在克服机器学习模型“数据饥渴”短板,让训练模型能够倚赖少量数据见微知著、举一反三,对现实世界的事物与动态做出准确的预判。
AI未能制止疫情蔓延
2.谷歌的子公司DeepMind所开发的AlphaFold系统在Critical Assessment of Structure Prediction(CASP)结构预测关键评估挑战赛中,以略高于90%的准确度,成功预测蛋白质的三维形状。不少媒体用人工智能解开了困扰人类50年的生物学蛋白质折叠难题来形容这项科研突破。专家认为,这项突破有望协助人类充分理解病毒和癌细胞的蛋白质结构,以寻求在治疗棘手的瘟疫、癌症等生物科技上取得实质的进展。
3.OpenAI所开发的GPT-2据说能够自学下象棋,还能作曲。在2020年6月公布的GPT-3能写诗、创作剧本,用CSS、JSX、Python等程式语言编程,并应邀在英国的《卫报》撰写一篇由人类编辑合成的文章。
4.在2020年8月18日至20日期间,由Heron Systems开发的人工智能系统,在美国国防高等研究计划署(DARPA)举办的AlphaDogfight模拟空战竞赛中,以5比0战胜美军顶尖F-16战斗机飞行员。
5.苹果和微软追随谷歌与亚马逊的步伐,加大对自主研发和生产AI晶片的投资,放眼不再受制于半导体厂商或中美贸易战博弈的掣肘,达到在软硬体上自给自足的长远维续目的。
无论如何,在2020年,数据驱动人工智能也呈现了一些不太乐观的景象:
1.无人驾驶汽车没有落地,也没有在可预期的短期内大规模安全上路的迹象。
2.人工智能没有在严格意义上探测到并及时制止新冠肺炎瘟疫的爆发与蔓延。
3.数据驱动人工智能模型,在新冠肺炎造成世界各地限行、封城,全民居家工作与上课以免受到感染的情况下,频频出错,无法准确评估消费者和借贷者的信贷评级、消费趋向等。这引发了当前最火红的机器学习和深度学习人工智能技术,只能在常规状况下正常运作的隐忧。
4.基于无法以面部准确识别有色人种尤其是黑人女性,国际商用机器、亚马逊以及微软在各种层度上放弃在短期内允许人脸识别系统应用于警方执法。
5.著名黑人女性谷歌人工智能伦理守则专家,由于坚持以谷歌员工的名誉,发表大型语言模型带有难以能轻易根治的性别歧视和种族歧视等偏见,以及极其耗能、耗数据、不利环境等,被谷歌解职。这起事件所反映的矛盾,其实可能远比我们在媒体舆论上观察到的阶级和种族矛盾还要深刻──我们当前最热切追求与全力投资的AI技术是不是健全的,还是有难以被逆转的内在缺陷?
引导舆论左右观点
诚然,人工智能只有在与人类的作息紧密关联的情况下,才会被广泛地采纳与接受。在资本主义挂帅的年代,使AI融入人类日常生活最直接的途径就是,将AI应用于消费主义当中。这也是当前许多企业和科研单位构思、设计以及开发AI用例的方式。
在消费主义的驱使之下,AI应用程序的开发虽然不一定会以人为本,却跳脱不了以人类本身为设计主题的中心。许多能够反映人类好恶的网络活动数据以及线上消费经历,被用于训练AI模型。人类对AI驱动电子事件的反应,被视为评估AI模型的有效性的标杆。企业和商家希冀消费者将会产生的反应和做出的决定,被定义为AI建模的目标。
遵循这条思路,无可避免的,许多市面上所流行的AI模型,都以影响人类的审美品味和消费观点为目的。而AI模型所触发的数据驱动数码事件,还可能连带改变人类用户的行为与信念。
数据驱动人工智能或许还没有能耐在顷刻间为人类的生活带来翻天覆地的变化;但它却会为商家带来隐藏的商机,为意图引导民众舆论的广告商、营销业者、媒体,甚至是政治势力带来左右普罗大众观点和行为的数码方程式。
总的来说,基于统计学的神经网络(机器学习和深度学习)技术之所以被吹捧为现代AI的支柱,在于它能够持续通过数据所提供的反馈来验证其有效性,以及勾勒未来的长期价值。
从修辞层面来解读,数据驱动人工智能本身是当代企业复兴和大国崛起大叙述里的要角。它能通过形象化的数据图像勾画人类决策者已经平白浪费的过往机会成本,还有在当下能够把握,以及在未来可以从数据中持续发掘的增长契机。c