半小时，“数字人”诞生！

发表评论

A+

编者的话：今年“双11” ，国内各大电商平台直播间上线多个“数字人”主播，不仅“照片级别”复刻真人表情动作，还能24小时直播带货、流利解答消费者疑问、推荐多种省钱团购……

有数据统计，目前在中国从事视频表演等活动的主播账号有近1.4亿个，其中虚拟“数字人”占了四成，超过5000万个。 “数字人”如何诞生？还有哪些应用场景？未来可能面临哪些风险和机遇？《环球时报》记者对此进行了调查。

京东言犀大模型生成的“数字人”

半小时，一个“数字人”诞生！

“数字人”又称“2D真人孪生数字人”，指人们通过计算机技术模拟出一个类似真人的虚拟人形象。京东云言犀数字人产品负责人接受《环球时报》记者采访时，梳理了以大模型为代表的人工智能技术，如何从无到有创造一个“数字人”。

简单说，一个“数字人”诞生需要历经三个步骤。第一步，“人像视频拍摄”。仅需采集真人主播的形象外貌、声音等音视频数据，比如，可以在录影棚采集1至2个小时真人带货视频等。实际上，上述负责人介绍，在现有大模型技术加持下，已经可以做到只需采集真人3到5分钟的视频。

第二步，“形象声音模型训练”。包括音视频预处理、自动化数据标注、3D人脸重建、口唇驱动训练等。简单说，就是把这三五分钟视频放入京东云自主研发软件“数字人自助克隆工具”中，24小时内，就可以生产一个“数字人”。

“我们其实还可以做得更快，例如可以有针对性地对主播带货的状态进行数据采集，半个小时就能生产出来一个用于直播带货的‘数字人’。”上述负责人告诉记者，目前，京东云大概为4000个品牌提供“数字人”服务。

以直播“数字人”为例，形象定制费用大概几万元左右，也有更快速轻量化以及批量化定制形象可直接使用，费用不到一万元。两者区别在哪？前者生成的“数字人”，口唇匹配、神态表现的效果可以根据客户需求定制。但从商业应用的角度考虑，后者性价比更高，成本更低。

第三步，投放给用户，将“数字人”形象应用在不同场景。今年9月，新浪微博曾上线一段视频，人工智能学者高庆一的“数字人”和京东嘉宾的“数字人”进行了一场对谈。视频中，“数字人”高庆一的走动、手势、表情，以及和京东“数字人”嘉宾之间的互动，几乎可以模拟真人，但仍能看出和真人之间的差距。

“从整个制作的技术角度来讲，行业内目前比拼的是怎样用更快的速度，更低的成本，去复制和克隆‘数字人’。”该负责人告诉记者，很多“数字人”看起来表情比较呆板且姿态固定，仅手部有一些小动作，如何生成大姿态，如侧脸、走动、手势等，也是行业内急需突破的一个技术难点。

目前看，“数字人”成本十分具有诱惑力。据介绍，言犀虚拟主播成本不足真人的1/10，除一台电脑和一个运营人员外无需其他投入。

上述负责人为记者举了一个国产化妆品牌使用“数字人”直播的例子，借助基于大模型的直播文案自动生成，品牌方只需2至3个小时就可以完成直播间剧本的搭建。如果使用真人直播，100多款产品靠人工编写直播剧本，可能要花费两三天。效果方面，数据显示，使用“数字人”和真人接力直播后，直播间月销量翻了3倍。

多方推动“数字人”更多落地

今年杭州亚运会开幕式，观众对参与点火的“数字火炬手”印象深刻。随着人工智能技术的不断成熟，此类“数字人”已经越来越走近普通人的生活，在电商带货、在线直播、新闻播报等领域大显身手。

中国人工智能企业科大讯飞虚拟人平台总经理郜静文15日告诉《环球时报》记者，科大讯飞的虚拟数字人应用覆盖媒体、教育、金融、文旅、政企等，虚拟人可以担任虚拟主播、虚拟老师、虚拟客服、虚拟导游、虚拟政务导办员等角色。

据郜静文介绍，“数字人”的成本主要包括构建成本、技术服务成本、自主运营成本，目前各块成本随着技术和应用场景的迭代改进也在持续降低，如2D真人构建的虚拟人，前几年训练需要30分钟的数据，目前数据在3分钟乃至30秒也可以完成构建，“这方面技术的快速发展，也是真实场景落地需求给技术带来的巨大推动力”。

“数字人”在日本也非常火爆，很多行业开始起用虚拟数字人进行服务接待。据日本朝日电视网报道，日本电报电话公司开始使用虚拟数字人担任接待向导。这个“数字人”是由9名真实员工和其他人的面孔合成的，而声音和动作则是基于AI技术。报道称，这是日本国内首个真人大小的“数字人”，除了前台接待外，该“数字人”还将用于商务客服等。

美国科技公司通过打造虚拟网红来帮助企业吸引流量。统计显示，2022年，大约35%的美国消费者购买了“数字人”推广的产品，千禧一代和Z世代成员占这些客户总量的40%。据Territory Influence称，虚拟网红市场目前价值46亿美元，预计到2025年将增长26%。

艾媒咨询提供的《2023年中国虚拟人产业发展与商业趋势研究报告》显示，2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元，预计2025年分别达到6402.7亿元和480.6亿元。

目前，最常见的“数字人”出现在电商直播领域。京东云言犀数字人产品负责人接受《环球时报》记者采访时表示，“数字人”未来的应用场景非常广阔，金融机构、机场、政务部门等，都需要“数字人”员工提供服务，比如说充当办理线下业务的银行业务员、机场向导等等。

未来随着人工智能技术的迭代，上述负责人表示，“数字人”表现力将更加逼真，不仅仅在外观上，甚至在一些说话办事风格上，“数字人”都将被赋予更多“智能”，在一些服务类的场景迅速落地，满足企业、机构的多种需求。

谈及“数字人”的未来应用场景，对外经济贸易大学国际关系学院学者梁怀新对《环球时报》记者表示，“数字人”已经在电商直播等领域得到充分应用，但其在自身的类人化呈现、交互感受等层面还存在很大的拓展空间。随着这些技术层面问题的解决，“数字人”的应用场景将会进一步拓展，在数字偶像、数字诊疗、数字谈判、数字电游等领域还会有更大的应用空间，可以被用来打造大IP娱乐明星、类人化诊治医师、谈判助手、全息游戏等。

这些风险需要重视

随着“数字人”在越来越多的场景得到应用，其风险与监管问题也日益突出。对外经济贸易大学国际关系学院学者梁怀新告诉《环球时报》记者，一方面，“数字人”在设计过程中需要采集仿生对象的个人数据，如果储存不当，容易造成隐私数据泄漏，产生冒用个人声音、肖像进行诈骗的问题。

另一方面，“数字人”的大量使用也会对劳动力市场产生冲击，使得人类的工作机会被大量占据，带来大规模失业风险；此外，“数字人”的安全问题还体现在会使大众社交方式“脱实向虚”、社会资本向数字领域过度聚集等方面。

在制作“数字人”前，京东方面表示，会与出镜人员签订肖像权在内的授权协议等。在采集“数字人”对标的真人的肖像、声音等数据前，京东云言犀数字人产品负责人接受《环球时报》记者采访时也表示，必须跟真人主播签订相关的法律授权协议，包括肖像使用场景、范围等，都要详细约束。

而从数据安全性的角度来说，京东平台以及算法等，需要在国家工信部进行算法技术备案。此外，相关部门还要求对虚拟形象使用加密技术，需要确保虚拟形象不管投放在哪，都能做到可追踪，保障这些“数字人”的安全性。

“在虚拟数字人的应用安全方面，监管部门和行业都非常关注，在版权授权、技术认证、内容安全、展示鉴别等方面进行规范。”科大讯飞虚拟人平台总经理郜静文向《环球时报》记者介绍说，虚拟“数字人”的构建需要得到版权人的同意，技术公司的生成式技术需要得到相关单位认证，应用方和平台方需要对内容安全进行审核和监管，用户获得时有明显或隐形的展示虚拟数字人的信息告知等。

据了解，现阶段，为规范“数字人”及相关产业，我国已经颁布了《生成式人工智能服务管理暂行办法》等一系列相关规章。2022年11月25日，国家网信办、工信部、公安部联合发布《互联网信息服务深度合成管理规定》（以下简称《规定》），旨在加强互联网信息服务深度合成管理。《规定》提到，深度合成服务技术支持者应当履行备案和变更、注销备案手续。

梁怀新表示，未来针对“数字人”在著作权、肖像权、数据隐私、平台监管等方面存在的问题，可通过“综专结合”思路，率先在行业内制定专门解决“数字人”具体安全隐患的行政规章，并争取早日出台“数字人”监管的国家综合法规。

半小时，“数字人”诞生！