Press "Enter" to skip to content

Veritone语音合成技术: 使名人声音克隆成为可能

编者按:本文来自微信公众号 “将门创投”(ID:thejiangmen) ,作者:让创新获得认可,36氪经授权发布。

 

近年来,随着机器学习技术的发展,语音合成技术得到了迅速的改善,能够创造出越来越逼真的声音。最近,Veritone推出新平台让名人和有影响力的人用AI克隆自己的声音!

 

录制广告和代言产品对名人来说可能是有利可图的工作,但是他们有可能因为没有时间或者录制工作比较艰苦而无法去做,这就是美国公司Veritone开发Marvel.AI平台的初衷——让AI合成声音代替真人去工作。

 

节省名人时间是初衷

 

前段时间,郑爽迅速升级为计量单位,一爽=1.6亿,郑爽一天=208万。

 

对明星来说,即便天价片酬已经让普通人望尘莫及,但是拍剧太辛苦的声音仍然不绝于耳。

 

 

这正是美国公司Veritone的赌注。对名人和网红来说,不提拍摄剧目的工作,录制广告和代言产品这种多快好省、利润丰厚的工作也是十分劳累的……

 

5月,Veritone推出了一个名为Marvel的新平台。在Marvel平台,人工智能可以让创作者、媒体人物克隆自己的声音,生成深度伪造的声音复制品,并按照他们的意愿授权使用。

 

声音资产如何变现

 

Veritone总裁瑞安·斯蒂尔伯格为这项略显“作弊”的业务解释道:“明星、网红他们没有足够的时间去演播室录制工作内容。”

 

瑞安·斯蒂尔伯格给Marve.AI的定位是:把声音变成资产,深度伪造后的声音将成为那些有影响力的人、运动员、名人和演员个人品牌资产的一部分。

 

等等?

 

你以为这真的是侃爷的Yeezy,品牌说来就来?如果技术发达到人人都可以克隆并授权使用自己的声音,这也不存在品牌效应了吧。

 

斯蒂尔伯格表示,有了Marvel.AI,任何人都可以创造自己声音的复制品,并在他们认为合适的时候使用它。比方说,当明星Y在睡觉的时候,他们的声音可能会传出来,录制广播节目、阅读有声读物等等。斯蒂尔伯格表示,该平台甚至可以利用档案录音来训练人工智能模型,让死人的声音复活。

 

 

Veritone的Marvel.AI平台

 

他说:“谁拥有这些声音的版权,我们就与他们合作把声音带到市场上。声音的应用合适与否将取决于版权持有者个人的观点。有了这项技术,你甚至可以让沃尔特·克朗凯特再次阅读晚间新闻。”

 

近年来,语音合成技术得到了快速的改进,机器学习技术使人们能够创造出更加真实的声音。对比2011年苹果发布Siri时的声音和现在的智能语音,由此可见一斑。

 

许多像亚马逊这样的大型科技公司都提供现成的文本语音转换模型,这种模型可以大规模地产生优美的机器人声音,而且往往这种机器人声音不会令人不快。

 

一些新公司也在制造精品语音克隆使这些声音听起来像是特定的个人,结果与真实声音相差无几,例如播客主持人乔·罗根的语音克隆:

 

https://youtu.be/DWK_iYBl8cA

 

(播客主持人乔·罗根的语音克隆视频)

 

大多数网友也认为乔·罗根的这段语音克隆太逼真,让人细思极恐。

 

正是语音克隆质量上的飞跃促使Veritone创造了Marvel。斯蒂尔伯格说,人工智能以及合成语音的潜力与公司现有业务相吻合。

 

以广告和版权出售为主的盈利模式

 

尽管Veritone自称是一家人工智能公司,但其大部分收入显然来自广告和内容授权。正如斯蒂尔伯格解释的那样,其广告子公司Veritone在播客领域投入了大量资金,每个月与网红名人整合的广告超过75,000次。

 

 

该公司的另一个部门Veritone Licensing则主要对一些档案的视频进行授权。其中包括CBS、CNN等广播公司,以及NCAA和US Open等体育组织拥有的视频。

 

“当你在电影中看到阿波罗登月的画面,或耐克广告中老虎的字眼,所有这些都是通过Veritone授权的,”斯蒂尔伯格说。

 

他表示,与纯粹专注于技术的人工智能初创公司相比,Veritone在授权和广告方面的经验将赋予其优势。

 

Marvel.AI 平台将为用户提供两种服务。一种是自助服务模式,任何人都可以从预生成的声音目录中选择一些声音,并按需创建语音内容,亚马逊、微软等公司多年来就是这幺做的。

 

另一种模式则是Marvel.AI独家打造的王牌:通过用户提交的语音数据,Veritone将为他们“量身创造”一个语音克隆。生成的模型将存储在Veritone的系统中,并在用户需要时自动生成所需音频。

 

Marvel.AI拟将这个语音库平台打造为语音买卖市场,允许潜在买家提交使用这些声音的请求,虽然这一切将如何定价尚不清楚。

 

Marvel.AI的市场潜力不可小觑

 

不过可以确定的是,斯蒂尔伯格确信市场对这些声音的需求是存在的,Veritone的商业模式已经蓄势待发。

 

事实上,Marvel.AI能否成功更取决于平台能够生成的AI声音的质量,而这就不是那幺确定了。

 

Marvel.AI首次放出的成品包含了三个短片,第一幕由斯蒂尔伯格本人朗读,第二幕由他的克隆AI朗读,第三幕把克隆换成了女声。总体来说,虽然第二幕克隆声音比真声更平、更短,但总体上算是一个相当不错的模仿了。换成女声后的第三幕除了声音短平外,还有一些缺陷,限制了声音的自然性。

 

斯蒂尔伯格强调这项技术正在迅速发展,而且Veritone拥有最先进的资源和专业知识,可以在未来几年采用任何新的机器学习模型。

 

声音合成产业的隐忧

 

假设Veritone大火,市场面临的第一个问题便是合成语音可能会稀释代言的力量。毕竟,产品代言的吸引力取决于代言人的一种“信念”,即这个代言人确实喜欢这个品牌的食物、牙膏或人寿保险。

 

如果明星自己都懒得自己代言,这难道不会影响广告的销售力吗?

 

斯蒂尔伯格的解决方案是为语音合成建立一个行业标准,在合成语音之前播放某种声音,让听众知道这不是本人真实的声音,也让他们相信声音的主人认可这种用法。他说:“这不仅仅是为了避免欺骗消费者,而且也是为了让他们确信代言人认可这种合成内容。”

 

写到这里,小编想说,技术是可贵的,但语音合成的真实用途却令人迷茫。Veritone笃信为明星网红开发的“声音克隆神器”将在不久的将来推而广之,但这同时也是明目张胆地将明星的生存压力再度缩小化。

 

内卷之风满地吹,唯一不受其害的似乎就是娱乐圈了。但如此一来,中国最应该内卷的也该是娱乐圈!

 

Veritone的定位很明确,它面向娱乐圈、体育界,但它会受到大众的认可和欢迎吗?毫无疑问,斯蒂尔伯格的语音市场将受到资本家的欢迎,但能否在各国的舆论环境下落地仍是未知数。

 

From: the verge ; 编译:Shelly

 

Illustrastion by Sara Maese from Icons8

 

– The End –

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注