虚拟数字人
虚拟数字人(Virtual human、digital human),指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的技术。
狭义的数字人是利用信息科学对人体进行虚拟仿真,是一种信息科学与生命科学融合的产物,最终目的是建立多学科、多层次的数字模型,达到对人体从微观到宏观的精确模拟。广义的数字人是指数字技术在人体解剖、物理、生理及智能的各个层次、各个阶段的渗透。虚拟数字人具备三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想,具有识别外界环境、与人交流互动的能力。
虚拟数字人具有“新媒介”属性,是基于“聚合科技”创造的数字形象,在元宇宙中担任信息制造及传递的载体和纽带,作为孪生介质将元宇宙中的“人—物—场”紧密链接在一起。作为新生事物,人们对于虚拟数字人的认识还存在空白。在体系标准层面和安全伦理层面,业内缺乏统一技术标准和要求,产品质量良莠不齐,相关法律法规、伦理规范也尚待完善,存在一定潜在风险。这也是一个“数字人权”的时代,需要在立法和行业标准制定方面持续推进,以完善的法律法规体系保障技术为人类所用,而不是技术支配人类。
发展沿革
发展背景
虚拟数字人起源于自动机器,自动机器是指人类借助已知的某种生物的某种功能上的逻辑,对机器进行功能模仿,借助两者的相似性来发明制造自动机器。自动机器往往是对常见生物功能逻辑的模仿,与被模仿的生物具备一定的相似性。世界上第一个具有人类特点的自动机器是由意大利博学家列奥纳多·达·芬奇所制作的后被命名为Leonardo's robot的武士机器人。
数字人虚拟化人格的雏形出现在1927 年,当时出现了世界上最早的游戏NPC,NPC(Non-Player Character)是非玩家控制角色的缩写,是游戏中的一种角色类型,这种角色与玩家控制角色不同,可以根据玩家在游戏中进行的一定行为做出相应的反应。随着计算机的发明,人们在与自动机器进行交互时已经不满足于简单的交互模式,而是对自动机器有一定智能化的需求。计算机科学、人工智能专家艾伦·麦席森·图灵在文章中提出相关思考,如果在与计算机进行交互时,计算机对外界交互的反应与人对其的反应并无二致,那么可以认为计算机可以思考。图灵测试就是基于这种模式进行的。在图灵测试诞生后的半个世纪,大量科学家制作智能体尝试通过图灵测试。
发展历程
第一代
1966 年,美国麻省理工学院计算机科学教授怀申鲍姆(Joseph Weizenbaum)在创造出世界上第一个完全基于计算机的人物,这也是世界上第一个数字人。1966 年怀申鲍姆教授利用计算机创造了一个名为 “伊莱扎”(Eliza) 的计算机程序,这个程序被用在关于自然语言处理的实验中,“伊莱扎” 可以通过计算机和外界进行交互,试验者可以通过键盘输入句子与其进行沟通交互,可见数字人已经可以在某些特定的情况下被当作真正的人。
第二代
第二代人工智能开始配备了传感器,并采用计算机为核心的控制。最常见的第二代人工智能便是配备了最初的语音助手。1970 年,美国科学家贾里尼克提出了“基于数据统计的语音识别框架”的理论,使人与人工智能的交互迎来语音识别这种新方式。贾里尼克带领IBM 公司麾下的著名实验室——华生实验室,在语音识别系统中运用统计学、信息论等相关原理,为语音识别系统用新的方法搭建基础框架,从根本上使得语音识别系统有了可用性。虚拟数字人概念最早起源于1990年的日本动漫,是通过绘画、动画、CG技术等,在虚拟或现实场景中实现非真人的形象。
第三代
第三代人工智能则是在第二代的基础上具备了一定的独立思考能力。2006 年迎来了第三代人工智能的革新,第三代人工智能的核心理念被谷歌的人工智能科学家团队提出,那就是通过深度学习,即一种通过算法让计算机主动学习,使人工智能具备一定的独立思考能力。数字人开始拥有了自主学习的能力,数字人的智能性也获得了飞跃式的提升,人们开始倾向于将“数字人”当作“人”了。2010年苹果公司推出了自己的AI 助手“Siri助手”,“Siri”的应用标志着AI 数字人已经走进了人们的生活。至此,数字人已经拥有了一定的人格化特征,拥有了自主学习的能力,也拥有了一定的智能性,已经越来越接近于真实的人。
第四代
第四代人工智能是通用型的,目前还未完全成熟。随着物联网时代的到来,万物实现互联,数字人可以通过网络对各种传感器进行消息的接收,再次通过网络对链接互联网的设备进行相应的控制,辅助我们对各种电子设备进行控制。随着可以链接互联网的电子设备的普及,人工智能的通用性将会越来越强,最终进入成熟阶段。
其中,ChatGPT 是一种大型语言模型,由OpenAI 设计训练。它使用深度学习技术,可以对自然语言进行解析,然后生成回答,而不需要预先编写具体的规则指令,这使得ChatGPT 成为一种非常灵活和智能的工具,可用于多个领域的应用,如自然语处理、机器翻译、人机交互等。ChatGPT 的出现和不断发展,改变人机交互的方式,推动智能化技术应用于更多领域。
基本原理
原理
虚拟数字人是由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。实现了现实与虚拟的对比结合。狭义的数字人,是利用信息科学对人体进行虚拟仿真,是一种信息科学与生命科学融合的产物,最终目的是建立多学科、多层次的数字模型,达到对人体从微观到宏观的精确模拟。广义的数字人,是指数字技术在人体解剖、物理、生理及智能的各个层次、各个阶段的渗透。在人工智能典型的应用市场中,计算机视觉、语音语义、机器学习和知识图谱几大板块表现突出。
计算机图形学
将计算机图形学引入到虚拟人中,使效果、质量及制作效率得以大幅度提高,生成动作的方法也多种多样,比如基于特征的图像变形、二维形状混合、轴变形方法、三维自由形体变形等。
语音识别
虚拟数字人与纯聊天机器人的不同之处在于其具体的视觉外观和声音,它表达的信息远远多于纯文本系统,例如肢体语言或面部表情。
深度学习
最初的深度学习是受到人脑神经系统的启发,利用深度神经网络来解决特征表达的一种学习过程,通过多个隐含层的神经网络结构提高机器训练学习的效果,例如DNN深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)、长短期记忆网络(Long Short-Term Memory,LSTM)、生成式对抗网络(Generative Adversarial Networks,GAN)等。
特征
数字人的拟人化以及生产制作的自动化程度,反映数字人系统整体进化和发展水平,代表着数字技术综合运用能力和成熟度体现。
从最小的范畴说起,虚拟数字人具备三方面的特征:
一是拥有类人的外观,具有特定的相貌、性别和性格;
二是拥有类人的行为,能够用语言、面部表情和肢体动作进行“自我”表达;
三是拥有类人的思考方式,能够识别外部环境,并与人交流互动。
综合来看,就是具备四方面的能力,即形象能力、感知能力、表达能力和娱乐互动能力。可以结合这些特征和能力来判断这个虚拟数字人的可信度。
分类
虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成。其中,视觉和听觉是人与人或人与机器交互中两个重要的感官通道,这两种感官通道中的信息密切相关。
非交互型数字人
系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。
交互型数字人
智能驱动型数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动。
真人驱动型数字人:真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。
社会应用
市场前景
2021年12月,有行业报告显示,2020年中国虚拟数字人行业市场规模约2000亿元,未来随着市场接受度拓宽,2030年中国虚拟数字人市场规模将达2700亿元。
2024年,全国范围内专注于数字人研发与应用的企业数量已攀升至114.4万家。2024年1月至5月,新增注册数字人相关企业17.4万余家。从行业分布来看,文化、体育和娱乐业,信息传输、软件和信息技术服务业合计占比超6成。2024年12月,中国互联网协会发布的《中国数字人发展报告(2024)》显示,2024年是数字人全面应用突破之年,预计2025年中国数字人带动产业市场规模和核心市场规模分别可达到6402.7亿元和480.6亿元。
应用场景
虚拟数字人已经在政务、金融、交通、物流、零售、制造业等多个行业落地,助力不同行业实现服务和营销的数智化转型。2021年12月,京东云表示,将不断深入探索虚拟数字人、多模态人机交互技术,以人工智能、大数据、云计算等技术为基础,通过数智能力提供解决行业痛点的虚拟数字人,树立人机交互发展、应用的新标杆,助力实体经济高质量发展。
2021年2月1日,万科企业首位数字化员工“崔筱盼”正式“入职”,在系统算法的加持下,它很快学会了人在流程和数据中发现问题的方法,以远高于人类千百倍的效率在各种应收/逾期提醒及工作异常侦测中大显身手,而在其经过深度神经网络技术渲染的虚拟任务形象辅助下,她催办的预付应收逾期单据核销率达到91.44%。
在电子商务领域,2021年双十一上,快手虚拟主播“小芳”直播带货,1小时的直播专场累计观看人数达105.4万,累计点赞量达17.2万。2024年6月,京东集团利用数字人“采销东哥”举办的直播销售活动,不仅创下了可观的观看记录,还实现了销售额的大幅增长,证明了数字人在电商领域的巨大潜力。
在人物应用方面,2023年12月3日起,泸州市广播电视台将“泸晓融”AI手语主播引入电视新闻,在每周日的《泸州新闻联播》中,AI手语主播“泸晓融”准时与大家见面。2024年11月,硅基智能打造CEO司马华鹏数字分身“simahuapeng.ai”,司马华鹏成为了全球首位实现数字化自我分身的企业家。这一技术不仅在科技圈引发了热议,也标志着AI在高层管理和个人工作效率提升方面迈出了具有里程碑意义的一步。
银行业也不甘落后,继中国工商银行的“小天”、上海浦东发展银行的“小浦”、百信银行的“艾雅”等虚拟数字员工,2024年中国邮政储蓄银行推出了3D虚拟数字员工“邮小贝”,“邮小贝”可以提供智能问答、业务办理、产品介绍等服务,已然承担起“数字客服”和“数字客服经理”的角色。
在运营商方面,2024年,中国电信集团依托AI大模型的强大能力,数字人客服“小翼”的升级与优化也将进一步创新迭代;中国电信爱音乐超写实数字人浅然则积极拥抱AI,带领观众进入一个充满无限可能的AI世界。更是联合阿坝藏族羌族自治州文化体育和旅游局打造数字熊猫“苏琳”。通过端云技术,将构建一个超现实的野生栖息地环境,游客可以通过手机与“苏琳”互动,获得个性化的旅游建议。
伦理问题
综述
在政策规制上,要“道义”“信义”两手硬。一是目标上,要避免“逐利”而“废道”的现象。应用于科普的虚拟数字人不应仅以实现盈利为目标,还应该重视虚拟科学人的科学价值引领功能、科学精神弘扬功能、提升公民科学素质功能等。二是具体政策上,要重视“可控”与“可信”。
作为新生事物,人们对于虚拟数字人的认识还存在空白。在体系标准层面和安全伦理层面,业内缺乏统一技术标准和要求,产品质量良莠不齐,相关法律法规、伦理规范也尚待完善,存在一定潜在风险。要加紧研究各类虚拟“数字人”应用对人的心理影响,以及对人类社会带来的影响,并尽快出台相关法律法规和伦理规范。
培育数字素养
首先要解决的就是人的自主意识丧失的问题。即在人类与技术高度融合的情况下,如何确保人具有主体性、主导性、自主性。要解决这一问题,就要持续对人们进行数字素养培训,使人们站在技术发展的最前沿,具有掌握、运用各项数字技术的能力。
嵌入伦理价值
一是将人类的伦理原则嵌入算法,改变元宇宙(数字人)的基础构架。数字人运行的基础架构是智能算法,若在智能算法中嵌入人类的伦理原则,那么,智能算法将会被这些伦理原则所规训,朝着人们期望的方向发展。
二是将负责任的技术创新贯穿于技术发展的全过程。要改变过去技术开发仅仅是科技人员工作的科技创新逻辑,让更多的社会公众和专业人士参与到元宇宙的技术开发和使用过程中。
三是坚持批判思维。在操作层面,重新确认元宇宙时代的人文主义价值。在思维层面,要通过批判数据主义,让人们不断增强自主意识,提升批判思维能力,回归到“他自己的活动,他自己的生活,他自己的享受,他自己的世界”中去。
完善法律法规
这是一个“数字人权”的时代。防范伦理风险,需要在立法和行业标准制定方面持续推进,以完善的法律法规体系保障技术为人类所用,而不是技术支配人类。
此外,在对可能出现的伦理风险进行防范时,需要积极推进国际合作,同世界人民一道,防范带给人类社会的伦理挑战。
相关事件
2024年5月17日,湖南博物院首次公开发布“辛追夫人”3D数字人形象。它以马王堆汉墓出土的辛追为原型,进行数字形象建立和互动智能体打造,最大限度复原了其容貌。此次官宣的“辛追夫人”3D数字人形象,分别为年龄约35岁的全身坐姿版和50岁左右的头部形象,不仅皮肤肌理清晰可见、毛发材质高度逼真,连服饰妆造都是根据出土文物进行一比一还原。此外,数字人的体态和面容等都是根据辛追生前身体真实情况进行模拟复原。据透露,完成版的“辛追夫人”3D数字人将成为全球首个基于2000余年前保存完好的真实湿尸为原型打造的虚拟数字人。
参考资料
“数字人”走进我们生活.新华网.2024-01-11
人工智能应用的市场潜力显现 商业变现有望加速.中国经济时报.2024-01-12
用一篇文章,帮你了解什么是虚拟数字人?.人人都是产品经理.2024-01-12
虚拟人有多火?地产巨头的优秀新人奖居然给了AI.今日头条-金融界.2022-01-04
2024年终盘点| 数字人市场蓬勃发展 亟需协同创新产业生态.今日头条.2024-12-24
虚拟数字人应用 加速产业渗透.新华网-经济参考报.2022-01-04
首位数字化员工亮相 万科很多员工不知给他们发邮件的“某位同事”不是人类.人民网.2024-01-11
「趣点」虚拟人有多火?地产巨头的优秀新人奖居然给了AI.东方财富网.2024-01-11
欢迎“泸晓融”! 《泸州新闻联播》AI手语主播即将上岗.酒城e通.2024-01-11
虚拟数字人做科普值得推广.人民网.2024-01-11
独家!解码AI如何重现马王堆汉墓“辛追夫人”真容.今日头条.2024-05-17