浅析数字虚拟人的探索与实践

  • A+
所属分类:heygen ai百科

浅析数字虚拟人的探索与实践

随着互联网的快速发展,在5G、人工智能、虚拟现实等新技术浪潮的带动下,虚拟数字人技术步入成长阶段,从外观的数字化逐渐深入到行为的交互化、思想的智能化、模式的创新化。2022年北京冬奥会是运动员的竞技场,也是机器人、数字人的秀场。冬奥手语播报数字人、新华社冬奥特约“数字人”记者、百度智能云AI手语主播、腾讯3D手语数智人“聆语”、AI气象服务虚拟人“冯小殊”等等。随着未来各领域规模不断扩展,智能客服行业有望持续快速增长。

虚拟数字人是以语音智能、计算机视觉、自然语言理解、机器翻译、人像建模、数字人驱动及合成等AI技术,以热线、互联网等渠道为载体,具有对物理世界的感知、认知与表达能力,“孕育”面向5G时代的、具备感知智能、认知智能、表达智能的多模态智能交互,实现人机交互的数字虚拟人。

01
走近数字虚拟人

1982年世界第一位虚拟歌姬林明美诞生,数字虚拟人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制作过程亦得到有效简化,从最早的手工绘制到现在的 CG(Computer Graphic,计算机图形学技术)、人工智能合成。在虚拟数字人产业链中,基础层提供软硬件的支撑;平台层为制作及开发提供技术;应用层为应用领域提供解决方案,赋能各领域发展。数字虚拟人产业进入门槛高,差异化显著,受众群体不断拓展,因而数字虚拟人价值凸显,应用领域不断拓展,未来有望加速商业化进程。

数字虚拟人集合人脸、手势、图像、情绪、语音等多模态完成交互流程,收集客户声音/画面等交互信息,通过语音识别(ASR)、人脸识别、手势识别、情绪识别、图像识别,数字人后台进行信息组织,通过对话系统(ChatBot)、自然语言处理(NLP)、知识图谱、预测/推荐等技术来实现数字人认知功能,结合业务知识库和对话设计模型,确定数字人需要表达的文字、情绪、动作传递给客户。随着元宇宙热潮,数字虚拟人作为先发场景产业更加备受关注。

02
数字虚拟人的架构

数字虚拟人具有形象能力、表达能力和感知互动能力三方面的特征:
1.拥有人的外观,具备相貌、性别、性格等人物特征。
2.拥有人的行为,具备用语言、面部表情、肢体动作等表达的能力。
3.拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
为此,数字虚拟人一般具有以下的架构设计:

浅析数字虚拟人的探索与实践


(1)人物形象设计,即人物生成,人物建模方面 2D 数字人较为简单,3D 数字人需要额外使用三维建模技术。

(2)语音生成模块和动画生成模块,可分别基于文本生成对应的人物语音以及与之匹配的人物动画。

(3)音视频合成模块:可将语音和动作合成视频,再显示给客户。

(4)交互模块:使数字虚拟人具备交互能力,即通过语音语义识别等识别客户意图,并根据客户意图决定数字虚拟人后续的语音和动作,驱动数字虚拟人输出对应的下一轮交互。

交互模块主要是根据业务场景需求划分,分为交互型数字虚拟人和非交互型数字虚拟人。非交互型数字虚拟人只有单向输出,没有对客户的感知,即依据决策生成对应的人物语音和动作,合成音视频呈现给客户。

交互型数字虚拟人则根据驱动方式不同,可分为智能驱动型数字虚拟人和真人型驱动数字虚拟人。智能驱动数字虚拟人是通过系统自动识别并解析客户侧输入的信息,根据解析和决策结果驱动人物模型生成响应的语音和动作,使得数字虚拟人和客户互动。真人驱动数字虚拟人,是通过真人来驱动数字虚拟人,主要原理是真人根据客户侧输入的信息,与客户实时语音,同时通过动作捕捉采集将真人的表情、动作呈现在数字虚拟人形象上,从而与客户进行交互。

智能驱动数字虚拟人的人物模型基本是预先训练生成的,可通过对应的信息驱动生成语音和对应动画。全双工技术将推进数字人交互方式的演变,使得数字人拥有一次唤醒、多次交互能力,具备实时智能响应、随时打断、智能纠错、多轮对话等功能。

03
数字虚拟人的实践

数字虚拟人,是一款能够以数字人形象与客户进行实时语音交互的智能多语种多模态交互客服机器人,不仅为客户带来“真人面对面”实时服务临场感,同时在对话过程中同步展示文字、图片、图表等可视化服务信息,实现业务咨询、办理、查询、营销,可以7×24小时在线协助客户自助解决问题,全面提升客户体验。

中国移动通信集团在线营销服务湖北分中心于2022年8月25日上线查询话费、查询流量场景,截至8月28日,数字虚拟人共服务客户1218余次,实现数字虚拟人从无到有的重大突破,期待逐步形成数字虚拟人的健康、有序、良性发展。

数字虚拟人服务的推出,实现了从“听+说”“说+看”的人机交互升级到“听+说+看”的人机交互

1.服务模式变革
客户在互联网渠道的客服入口中,可以享受同热线侧一样的一对一的面对面视频服务。可以提升沟通效率,缩短客户交互时长。

2.营销增值变革
在服务过程中,由面对面的视频代替文图聊天,增加客户粘性,在与客户实时交互中获取客户诉求,挖掘营销机会。

3.信息传播变革
当遇到紧急故障,可以通过主动给客户播放一个虚拟人的声情并茂视频来代替单一的图文提示。

4.降本增效变革
智能应答是针对在线人工座席降本增效,数字虚拟人则是针对5G视频人工客服降本增效。

技术迭代将会成为业务创新的主要驱动力,多模态交互的多元特性带来业务场景新变革,全新的“数字虚拟人”融合热线智能语音机器人及互联网智能文本机器人特点,形成“声文同显”优势,重构信息组织结构,极大缩短业务交互耗时,同时通过植入互联网生态运营元素,发挥自身声影并茂的特点,增加互动趣味性和粘性,全面提升客户体验,发挥出越来越大的作用

04
数字虚拟人运营思考

数字虚拟人,融合热线智能语音机器人及互联网智能文本机器人特点,形成“声文同显”优势,重构信息组织结构,极大缩短业务交互耗时,同时通过植入互联网生态运营元素,发挥自身声影并茂的特点,增加互动趣味性和粘性,提升客户驻留时长;实现多渠道业务融合,促进服务协同和精准营销。

1.为5G视频服务代言
客户进入5G视频服务中,为客户展示一个虚拟人像,后面支撑服务的依然是真人座席,目的是为客户提供统一美好形象。

2.人工服务语音定制
对于情绪波动较大的座席,可启用统一数字虚拟人声音,及时对一些脏字进行过滤,为客户提供情绪更稳定的人工服务。

3.故障高峰时的提示
遇到故障高峰时,用数字虚拟人在自助服务阶段声情并茂为客户提供提示。

4.话务高峰时的疏忙
集中扣费导致的话务高峰时,可以通过直观的卡片及视频播报,为客户更直观的释疑;对于并不需要进行扣费释疑的客户,可以在服务开始时,就加挂卡片,预提醒客户话务高峰,尽量通过自助服务解决诉求。

5.查询高峰时的展示
账单查询高峰时,可以通过惯性客户预测,在通过声音播报时,同步为客户提供更为直观账单信息卡片,以及客户看过账单后可能的诉求推荐卡片。

6.5G流量包的营销
对于5G流量包营销上,在语音播报时,可以提供数据图加文字的形式更直观的为客户展示优惠及好处,还可以加挂客户关注的问题,让客户既能快速了解其想看的信息,还能快速地解决疑惑。在服务过程中,通过客户的表达及客户消费状态,获取到客户有办理5G流量包的价值,实时的视频通讯能通过更高的粘性,提升自助办理的营销转化。

7.缓解视频座席压力
5G视频服务推广后,视频服务诉求高峰时,可以通过数字虚拟人分流解决客户,可以通过自助服务解决的诉求,缓解人工压力。

8.提升复杂业务效率
在线服务,更多的是文字聊天,如果客户的诉求是先查扣费情况,再查账单,再查询历史账单,实时的视频通讯服务能更快速地满足客户诉求,缩短服务时长。

9.输出视频营销服务
对于一些重点业务,需要通过视频进行营销的,可以通过数字虚拟人直接进行文字和动作配置,更快输出营销服务视频。
随着业务场景的不断丰富,数字虚拟人将对接公司重点发展任务,例如宽带排障、权益领取、终端销售等各个方面,力求取得规模化的增效降本,促进公司“推进数智化转型,实现高质量发展的发展主线的落地实施。


文 | 入驻作者康黎、徐雅芳、王晶、田莹

中国移动通信集团在线营销服务湖北分中心

来源 | 《客户观察》2022年11月刊P57-P62

↓↓ 了解近期活动资讯请点击下方图片 ↓↓


发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: