- A+
编者的话:今年“双11” ,国内各大电商平台直播间上线多个“数字人”主播,不仅“照片级别”复刻真人表情动作,还能24小时直播带货、流利解答消费者疑问、推荐多种省钱团购……
有数据统计,目前在中国从事视频表演等活动的主播账号有近1.4亿个,其中虚拟“数字人”占了四成,超过5000万个。 “数字人”如何诞生?还有哪些应用场景?未来可能面临哪些风险和机遇?《环球时报》记者对此进行了调查。
京东言犀大模型生成的“数字人”
半小时,一个“数字人”诞生!
“数字人”又称“2D真人孪生数字人”, 指人们通过计算机技术模拟出一个类似真人的虚拟人形象。京东云言犀数字人产品负责人接受《环球时报》记者采访时,梳理了以大模型为代表的人工智能技术,如何从无到有创造一个“数字人”。
简单说,一个“数字人”诞生需要历经三个步骤。第一步,“人像视频拍摄”。仅需采集真人主播的形象外貌、声音等音视频数据,比如,可以在录影棚采集1至2个小时真人带货视频等。实际上,上述负责人介绍,在现有大模型技术加持下,已经可以做到只需采集真人3到5分钟的视频。
第二步,“形象声音模型训练”。包括音视频预处理、自动化数据标注、3D人脸重建、口唇驱动训练等。简单说,就是把这三五分钟视频放入京东云自主研发软件“数字人自助克隆工具”中,24小时内,就可以生产一个“数字人”。
“我们其实还可以做得更快,例如可以有针对性地对主播带货的状态进行数据采集,半个小时就能生产出来一个用于直播带货的‘数字人’。”上述负责人告诉记者,目前,京东云大概为4000个品牌提供“数字人”服务。
以直播“数字人”为例,形象定制费用大概几万元左右,也有更快速轻量化以及批量化定制形象可直接使用,费用不到一万元。两者区别在哪?前者生成的“数字人”,口唇匹配、神态表现的效果可以根据客户需求定制。但从商业应用的角度考虑,后者性价比更高,成本更低。
第三步,投放给用户,将“数字人”形象应用在不同场景。今年9月,新浪微博曾上线一段视频,人工智能学者高庆一的“数字人”和京东嘉宾的“数字人”进行了一场对谈。视频中,“数字人”高庆一的走动、手势、表情,以及和京东“数字人”嘉宾之间的互动,几乎可以模拟真人,但仍能看出和真人之间的差距。
“从整个制作的技术角度来讲,行业内目前比拼的是怎样用更快的速度,更低的成本,去复制和克隆‘数字人’。”该负责人告诉记者,很多“数字人”看起来表情比较呆板且姿态固定,仅手部有一些小动作,如何生成大姿态,如侧脸、走动、手势等,也是行业内急需突破的一个技术难点。
目前看,“数字人”成本十分具有诱惑力。据介绍,言犀虚拟主播成本不足真人的1/10,除一台电脑和一个运营人员外无需其他投入。
上述负责人为记者举了一个国产化妆品牌使用“数字人”直播的例子,借助基于大模型的直播文案自动生成,品牌方只需2至3个小时就可以完成直播间剧本的搭建。如果使用真人直播,100多款产品靠人工编写直播剧本,可能要花费两三天。效果方面,数据显示,使用“数字人”和真人接力直播后,直播间月销量翻了3倍。
多方推动“数字人”更多落地
今年杭州亚运会开幕式,观众对参与点火的“数字火炬手”印象深刻。随着人工智能技术的不断成熟,此类“数字人”已经越来越走近普通人的生活,在电商带货、在线直播、新闻播报等领域大显身手。
中国人工智能企业科大讯飞虚拟人平台总经理郜静文15日告诉《环球时报》记者,科大讯飞的虚拟数字人应用覆盖媒体、教育、金融、文旅、政企等,虚拟人可以担任虚拟主播、虚拟老师、虚拟客服、虚拟导游、虚拟政务导办员等角色。
据郜静文介绍,“数字人”的成本主要包括构建成本、技术服务成本、自主运营成本,目前各块成本随着技术和应用场景的迭代改进也在持续降低,如2D真人构建的虚拟人,前几年训练需要30分钟的数据,目前数据在3分钟乃至30秒也可以完成构建,“这方面技术的快速发展,也是真实场景落地需求给技术带来的巨大推动力”。
“数字人”在日本也非常火爆,很多行业开始起用虚拟数字人进行服务接待。据日本朝日电视网报道,日本电报电话公司开始使用虚拟数字人担任接待向导。这个“数字人”是由9名真实员工和其他人的面孔合成的,而声音和动作则是基于AI技术。报道称,这是日本国内首个真人大小的“数字人”,除了前台接待外,该“数字人”还将用于商务客服等。
美国科技公司通过打造虚拟网红来帮助企业吸引流量。统计显示,2022年,大约35%的美国消费者购买了“数字人”推广的产品,千禧一代和Z世代成员占这些客户总量的40%。据Territory Influence称,虚拟网红市场目前价值46亿美元,预计到2025年将增长26%。
艾媒咨询提供的《2023年中国虚拟人产业发展与商业趋势研究报告》显示,2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7亿元和480.6亿元。
目前,最常见的“数字人”出现在电商直播领域。京东云言犀数字人产品负责人接受《环球时报》记者采访时表示,“数字人”未来的应用场景非常广阔,金融机构、机场、政务部门等,都需要“数字人”员工提供服务,比如说充当办理线下业务的银行业务员、机场向导等等。
未来随着人工智能技术的迭代,上述负责人表示,“数字人”表现力将更加逼真,不仅仅在外观上,甚至在一些说话办事风格上,“数字人”都将被赋予更多“智能”,在一些服务类的场景迅速落地,满足企业、机构的多种需求。
谈及“数字人”的未来应用场景,对外经济贸易大学国际关系学院学者梁怀新对《环球时报》记者表示,“数字人”已经在电商直播等领域得到充分应用,但其在自身的类人化呈现、交互感受等层面还存在很大的拓展空间。随着这些技术层面问题的解决,“数字人”的应用场景将会进一步拓展,在数字偶像、数字诊疗、数字谈判、数字电游等领域还会有更大的应用空间,可以被用来打造大IP娱乐明星、类人化诊治医师、谈判助手、全息游戏等。
这些风险需要重视
随着“数字人”在越来越多的场景得到应用,其风险与监管问题也日益突出。对外经济贸易大学国际关系学院学者梁怀新告诉《环球时报》记者,一方面,“数字人”在设计过程中需要采集仿生对象的个人数据,如果储存不当,容易造成隐私数据泄漏,产生冒用个人声音、肖像进行诈骗的问题。
另一方面,“数字人”的大量使用也会对劳动力市场产生冲击,使得人类的工作机会被大量占据,带来大规模失业风险;此外,“数字人”的安全问题还体现在会使大众社交方式“脱实向虚”、社会资本向数字领域过度聚集等方面。
在制作“数字人”前,京东方面表示,会与出镜人员签订肖像权在内的授权协议等。在采集“数字人”对标的真人的肖像、声音等数据前,京东云言犀数字人产品负责人接受《环球时报》记者采访时也表示,必须跟真人主播签订相关的法律授权协议,包括肖像使用场景、范围等,都要详细约束。
而从数据安全性的角度来说,京东平台以及算法等,需要在国家工信部进行算法技术备案。此外,相关部门还要求对虚拟形象使用加密技术,需要确保虚拟形象不管投放在哪,都能做到可追踪,保障这些“数字人”的安全性。
“在虚拟数字人的应用安全方面,监管部门和行业都非常关注,在版权授权、技术认证、内容安全、展示鉴别等方面进行规范。”科大讯飞虚拟人平台总经理郜静文向《环球时报》记者介绍说,虚拟“数字人”的构建需要得到版权人的同意,技术公司的生成式技术需要得到相关单位认证,应用方和平台方需要对内容安全进行审核和监管,用户获得时有明显或隐形的展示虚拟数字人的信息告知等。
据了解,现阶段,为规范“数字人”及相关产业,我国已经颁布了《生成式人工智能服务管理暂行办法》等一系列相关规章。2022年11月25日,国家网信办、工信部、公安部联合发布《互联网信息服务深度合成管理规定》(以下简称《规定》),旨在加强互联网信息服务深度合成管理。《规定》提到,深度合成服务技术支持者应当履行备案和变更、注销备案手续。
梁怀新表示,未来针对“数字人”在著作权、肖像权、数据隐私、平台监管等方面存在的问题,可通过“综专结合”思路,率先在行业内制定专门解决“数字人”具体安全隐患的行政规章,并争取早日出台“数字人”监管的国家综合法规。