如何在2023年以合乎道德的方式为企业使用生成式AI声音
由于OpenAI和ChatGPT的惊人普及,AI技术在2022年底得到了广泛采用。人工智能首次通过证明其在创造成功业务成果方面的效用和价值而获得了大众市场的吸引力。
许多在2023年对普通人来说似乎是一场革命的人工智能技术实际上已经被大企业和媒体积极使用了好几年。和我一起仔细研究为这些解决方案提供动力的技术,特别是用于语音克隆的生成式AI系统、其商业利益以及使用AI的道德方法。
语音克隆是如何工作的?
简而言之,语音克隆可以让一个人用另一个人的声音说话。
它使用生成式AI技术来创建一个人的声音的录音,并使用它们生成具有同一个人声音的新音频内容。它本质上允许人们听到别人会说的话,即使他们自己没有说。
在技术方面,事情似乎并不复杂。但是,如果您深入研究,则需要满足一些最低要求才能开始:
您需要至少5分钟的源语音高质量录制音频才能克隆它。这些录音应该清晰且没有背景噪音或其他失真,因为任何瑕疵都可能影响模型输出的准确性。
之后,将这些录音输入生成式AI模型以创建“语音化身”。
然后,训练模型以准确再现音调和时间方面的语音模式。
一旦完成,这个经过训练的模型可以使用任何其他人的源声音生成无限的内容,成为创建逼真的复制声音的有效工具。
这是许多人提出道德问题的地方。当我们可以将任何文本插入另一个人的嘴里并且无法判断这些词是真实的还是假的时会发生什么?
是的,这种可能性早已成为现实。与OpenAI和ChatGPT的情况一样,我们目前面临着许多不容忽视的道德问题。
人工智能的道德标准
与许多其他处于采用初期阶段的新技术一样,主要威胁是围绕该技术造成负面污名,而不是承认这些威胁是讨论和宝贵知识的来源。重要的是揭露不良行为者滥用技术及其产品、应用缓解工具并继续学习的方法。
今天,我们拥有与使用生成式人工智能相关的道德标准的三层框架。国家和超国家监管层正处于发展的初始阶段。政策世界可能跟不上新兴技术的发展速度,但我们已经可以观察到欧盟在人工智能监管方面的欧盟提案和2022年虚假信息实践守则概述了大型科技公司应对人工智能的期望。传播恶意人工智能操纵的内容。在国家层面,我们看到美国和英国在解决美国国家Deepfake和数字来源特别工作组和英国在线安全法案的问题方面采取了监管的第一步。
随着公司和技术人员接受这一与新兴技术及其对社会安全和隐私的影响有关的新现实,科技行业的层级正在加快发展。关于生成人工智能伦理的对话充满活力,并引领了围绕生成人工智能的使用制定行业行为准则的倡议(即人工智能合成媒体行为准则伙伴关系)和不同公司发布的道德声明。问题是,如何实践?而且,它们是否能够影响产品、特定功能和团队的程序?
在与许多不同的媒体和娱乐、网络安全和AI伦理社区合作解决这个问题后,我制定了一些实用原则来处理AI内容和声音,尤其是:
IP所有者和使用克隆语音的公司可以通过签署法律协议避免与使用原始语音相关的许多潜在并发症。
项目所有者应公开披露克隆语音的使用,以免听众被误导。
致力于语音人工智能技术的公司应该分配一定比例的资源来开发能够检测和识别人工智能生成内容的技术。
使用水印标记AI生成的内容可实现语音身份验证。
每个AI服务提供商都应在同意开展工作之前审查每个项目的影响(社会、商业和隐私级别)。
当然,人工智能的伦理原则不会影响自制深度造假的网络传播。但是,他们会将灰色项目推向公共市场之外。
在2021-22年,人工智能声音被用于不同的主流项目,这些项目对道德和社会产生了重大影响。其中包括为曼达洛人系列克隆年轻卢克·天行者的声音,为战神2克隆阿特柔斯的声音,以及为具有历史意义的“月球灾难事件”克隆理查德·尼克松的声音。
对技术的信心正在超越媒体和娱乐。许多行业的传统企业都在他们的项目中使用克隆的声音。以下是一些最突出的用例。
行业用例
到2023年,语音克隆将继续兴起,各行各业都将从中获益。从医疗保健和市场营销到客户服务和广告行业,语音克隆正在彻底改变组织与客户建立关系和简化工作流程的方式。
语音克隆有利于在线环境中工作的医疗保健专业人员和社会工作者。具有与医疗专业人员相同声音的数字化身可以促进他们与患者之间更牢固的联系,从而提高信任度并留住客户。
声音克隆在电影和娱乐行业的潜在应用是巨大的。将内容配音成多种语言、儿童和成人附加对话替换(ADR)以及几乎无限的定制选项阵列都通过这项技术成为可能。
同样,在运营领域,人工智能驱动的语音克隆可以为需要交互式语音响应系统或企业培训视频的经济高效解决方案的品牌带来出色的结果。借助语音合成技术,演员可以扩大他们的影响力,同时提高他们从录音中赚取残差的能力。
最后,在广告制作工作室中,语音克隆的出现有助于显着降低与商业制作相关的成本和时间。只要有可供克隆的高质量录音(即使来自不可用的演员),就可以比以往更快、更有创意地制作广告。
有趣的是,企业和SMB可以利用语音克隆为他们的品牌创造独特的东西。大型项目可以实现其最雄心勃勃的计划,而小型企业则可以使用以前成本过高的规模模型。这才是真正的民主化。
总结
AI语音克隆为企业提供了改变游戏规则的好处,例如创造独特的客户体验、将自然语言处理功能集成到他们的产品和服务中,以及生成听起来完全真实的高度准确的声音模仿。
希望在2023年保持竞争优势的企业应该研究人工智能语音克隆。公司可以使用这项技术解锁各种新的可能性,以在道德上负责任的方式赢得市场份额并留住客户。