郭德纲全英文说相声?这样的AI你汗流浃背了没?

  • A+
所属分类:heygen ai百科
最近,一段AI技术合成的郭德纲讲英语相声的视频,在各大社交平台都传疯了。
视频中,被称为“相声界泰斗”的郭德纲,用一口流利的英语,在麻省理工大学说相声,他不仅英语发音准确,而且和说中文时一样风趣幽默,连嘴型都十分自然。

(视频来源于网络)

除了郭德纲能用英文说相声之外,于谦也唱起了英文rap,泰勒·斯威夫特、艾玛·沃森甚至能在访谈中用中文对答如流。

 



01



AI技术又精进了?

 

似乎上一次引起广泛关注的AI还是AI孙燕姿。
无论是曾经红极一时的《青花瓷》,还是孙燕姿完全不可能演唱的《向天再借五百年》,都在被“AI孙燕姿”演绎得惟妙惟肖。
看过我们之前文章的小伙伴应该知道,AI孙燕姿本身并没有那么神秘。

和更为广泛使用的AI绘画一样,AI歌手也是通过大量的“干声”数据投喂,利用开源的AI声音训练模型训练所得的结果。
目前比较主流的AI声音训练模型有DiffSinger、Diff-svc和Sovits-svc等,而B站大部分UP主用的都是Sovits-svc。
(官方教学文档:https://github.com/svc-develop-team/so-vits-svc#readme)
现在网友们也已经整理出非常多关于AI翻唱的教程。
有网友表示,“跟着教程学习的话,即使是个新手,也只需要大概2个小时就能制作出一首和原歌手演唱非常相似的AI翻唱歌曲。”
与AI孙燕姿一样,AI郭德纲也是一夜之间席卷了全网,而这次的AI技术核心更为精进了。
它就是新的AI生成工具——HeyGen。
早在两个多月以前,HeyGen就曾经生成过一段在海外社交媒体上爆火的数字人视频,还是由创始人Joshua Xu亲自上阵。

(视频来源于网络)

视频中人物的表情、动作、语气等都和真人无异,甚至是AI数字人一直被诟病的人物“毛边”,都处理得非常细致。
创造HeyGen的公司名叫诗云科技,成立于2020年。
团队最初致力于做 AI 数字人生成,创始人Joshua Xu曾在Snapchat担任主要工程师,负责机器学习领域。
Joshua Xu曾公开表示,自2022年7月HeyGen发布以来,历时178天,该公司的年度经常性收入(ARR)已达到100万美元。
而HeyGen这个叹为观止的产品,除了高超的技术核心,还拥有一个更为人性化的设计——免费试用。

看到这里,或许你已经迫不及待想尝试一下。
不过,正因为HeyGen可以免费试用,所以目前已经排了长长的waitlist。
网传如果有技术基础的小伙伴也可以尝试寻找开源替代方案,比如语音转文字Whisper、声音克隆+生成音频Sovits-svc(AI孙燕姿使用的训练模型)、生成符合音频的嘴型视频GeneFace++。

 



02



会不会有侵权问题?

 

没错,AI郭德纲这么火,难免让人担忧这背后会不会有什么侵权隐患。
或许我们拿AI孙燕姿类比一下就能知道,确实可能涉嫌侵权。
从被换声模仿的公众人物角度来看,这里的侵权主要涉及两种,声音权和著作权。
声音和肖像一样,也有人身属性。
《民法典》第一千零二十三条规定,“对自然人声音的保护,参照适用肖像权保护的有关规定。”
而有关肖像权,《民法典》第一千零一十九条规定,“任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。”

而利用AI技术让郭德纲全英文说相声的行为,不仅使用郭德纲的形象去制作视频,且对他的声音及其表达进行了二次创作,确实存在侵犯肖像权的问题。
除此之外,AI郭德纲等AI明星,还有可能侵犯著作权。
现阶段,网友替换的大部分视频内容,比如相声、歌曲等,都属于我国《著作权法》保护的“作品”范畴,尤其是歌曲的著作权组成更为复杂。
以歌曲为例,一首歌曲往往包含词曲及演唱。
这就意味着未经授权擅自翻唱他人的歌曲,一旦侵权,就会涉词曲作者权、演唱者的表演者权,以及容易被忽略的相关唱片公司的录音录像制作者权等多项权利。
这个相对声音权会更好理解,毕竟真人翻唱“翻车”的也不在少数。

从斗鱼一姐冯提莫翻唱《恋人心》被判侵权,到知名游戏主播PDD一首歌唱丢10万元,延伸到AI明星翻唱或者AI相声表演,也是一样的道理。
此外,这类视频在未经著作权人授权的情况下,经二创后发布在网络上,造成广泛传播甚至牟利,还会涉嫌侵犯作品的信息网络传播权。
当然,这里提到的AI明星翻唱侵权,是指在公开表演的前提下可能涉嫌侵权。
如果仅仅是自己作为研究或者欣赏使用,且并不影响原作品的正常传播,也并未损害著作权人的合法权利,那就算作合理使用。

 



03



还有哪些安全隐患?

 

除了侵犯著作权,AI郭德纲还有着更深层的安全隐患。
据了解,HeyGen支持多种输入语言和输出语言,用户只需上传视频,选择语言,就能自动翻译、生成和原嘴型、音色都匹配的改编视频。
更令人惊叹的是,改编视频中的AI人和原视频中的人,不但口型、手势完全对得上,连内容和表情都非常一致,几乎听不出毛病。
这就引起了部分网友的担忧,AI郭德纲等会不会被用来模仿声音诈骗?
可别以为这是危言耸听,“卷福”本尼迪克特•康伯巴奇就曾是AI拟声的受害者。
据英国媒体《每日邮报》报道,一家西班牙小型电影制作公司称收到英国著名男演员“卷福”本尼迪克特·康伯巴奇的邀约,希望能够出演该公司即将拍摄的一部电影。
这部电影的导演称,他们最初收到邀约的时候并没有轻易相信,而是选择和对方通了个电话。
出乎意料的是,电话中对方的声音与卷福的相似度极高。
于是,导演放下戒心,完全相信对方是卷福本人。
“当我们接到电话时,简直不敢相信自己的运气,康伯巴奇是当下最有才华的演员之一,他居然会主动联系我们并对我们的项目表现出兴趣。”
正当电影公司的所有人都期待着与卷福的合作时,事情出现了转折。
“康伯巴奇”先是多次拒绝电影公司的邀约见面,随后便提出要公司先打款20万英镑(约合人民币170万元)给他才能正式合作。
这时电影公司意识到可能“中招”了,在向卷福所在的经纪公司确认后才发现,这完全是一场AI骗局。

 



04



写在最后

 

近年来,AI技术飞速发展,目前已广泛应用于短视频的二次创作,“AI换脸”“AI换声”等娱乐视频在B站等视频平台上一直都拥有较高的人气。
但玩归玩闹归闹,别把侵权当玩笑。
当这些AI技术被用于不法分子牟利、贬损公众人物形象、引导他人误解等用途时,伴随着的法律风险就无法忽视。
AI技术本身是一种中立的工具,关键在于应用这个技术的我们,要如何正确、合法地使用,从而真正做到推进发展,造福社会。

猴子音悦,版权好音乐

本篇文章来源于微信公众号: 猴子音悦版权音乐 喜欢可以搜索关注!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: