导论
“元宇宙(Metaverse)”是专注于社交功能的三维虚拟世界,正极大地吸引着学术界和工业界的关注。元宇宙的崛起,意味着一个现实和虚拟的融合社会正在到来。由于新冠疫情的侵袭,人们被迫在物理空间上保持距离,这在一定程度上弱化了传统社交,从而促进了元宇宙的发展。西湖大学AI团队从人工智能视角出发,规划了元宇宙的实现路径。首先,我们描绘了一幅路线图,如图1所示。遍历沉浸式创建、硬件支持、文本释义、语音处理、连接构建、经济系统和安全保护。其次,在图示的各个阶段,我们讨论了相关技术的发展现状,并深刻地剖析了现阶段的瓶颈挑战。AI视角下构建的路线图彰显了AI在元宇宙核心技术中所发挥的重要作用。
沉浸式创建是通过构建一个三维虚拟世界,为人类提供沉浸式感受的技术。近年来,AI迅猛发展彻底改变了该技术,比如AI能显著提升场景的生成速度,终将实现实时场景渲染。然而,人与数字人互动的沉浸感仍是个挑战,所以通过低成本、低带宽方式捕捉场景的计算成像来提供更高的沉浸感,将是未来的探索方向。
硬件是终端用户设备,如脑机接口、虚拟现实或增强现实(AR)头盔。这些设备已经历多次革命性进化,例如AR头盔,从宏观到微观光学,其设计正向纳米光学层级进军以期显著缩小尺寸。大规模衍射装置的设计是当前硬件发展的主要瓶颈,但AI正攻坚克难,与之相关的神经AI芯片亦蓄势待发。
文本释义是基于交流对话的文本生成与分析。元宇宙对商业记录和社会生活便利的程度,主要取决于AI领域中自然语言处理(NLP)的技术水准。NLP主要应用于私人助手和商业会议,而在融合社会中,如何实现与更为广阔的生活在不同时代背景的虚拟人沟通,定能使得元宇宙的用户体验更上一层楼。
语音处理是为了呈现听觉上的沉浸感。语音是元宇宙中各实体之间的主要交流工具,AI的发展将推动元宇宙中的实体如同在现实世界中一样交流。实现此沉浸感需克服许多挑战,如语音合成、复杂声景生成等,均依赖于先进的信号处理和AI声学技术。
连接构建包括网络连接和社会建立,是实现元宇宙用户社交的技术基础。为传输大量数据,元宇宙网络连接需克服延迟、带宽等障碍,而AI可在流量规划、拥堵控制等方面发挥重要作用。达成连接后,群体人所形成的社会,会发生差序格局等管理层面的问题。对此,AI亦可优化群体管理,将人们匹配到合适的圈子中,且提供社交活动所需的识别技术支持。
经济系统是指通过数字货币来交换虚拟商品的社会运作模式。虚拟经济的指数式增长使得大额资产管理和组织欺诈性交易成为技术挑战。对此,AI生成的NFT(不可伪造代币)与AI辅助资产标记可提高资产管理效率,同时AI也可借助去中心化区块链的基础设施建立全新的算法,以甄别交易的真实性。未来基于AI的虚拟经济系统将更为高效与可靠。
安全保护是指对用户隐私高效而可靠的庇护。大量虚拟设备连接或将折损连接的可靠性,为身份盗窃和间谍活动等有害网络安全的行为提供了可能性。为此,传统安全系统通常要求频繁的用户认证,此类低效费时的操作降低了用户体验。依托AI的生物识别或无缝认证将弥补这一缺陷。
此外,AI对元宇宙中其他同等重要的技术,如机器人、云计算、物联网和决策系统筹,也展现出了可圈可点的贡献。例如,强化学习能综合海量数据和多重因素,帮助做出更准确的决策,现已掀起决策分析的新潮。AI不仅推动了上述技术的演变,其本身也发展迅速。展望未来,AI将从“通过AI算法使硬件智能化”逐渐转向“通过AI算法构建智能硬件”。AI中的新技术,如强化学习、联邦学习、小样本学习等,可能会为实现元宇宙带来新的契机。
总结与展望
由AI驱动的新时代呼之欲出。AI将在元宇宙的发展过程中,在各个技术的变革中,起到关键和核心的作用。此路线图粗略地勾勒出AI视角下的元宇宙之路,从AI的角度,详解了7个主要技术及其他技术的研究现状及发展方向。畅想未来,AI可能会给元宇宙带来更多的变革。AI驱动的数字人已经出现,由AI驱动的社会、永生技术、经济系统筹,可能也会在元宇宙中出现。元宇宙也将经历更多革新,以满足未来社会发展的需要,而AI必将成为这场变革的先锋旗手。
发布人:周庆忠、童杨
供稿:S Cheng&S Li
编辑:游莎
责任编辑:朱志亮
审核人:黄晓生