近日,“知名相声演员用英语表演”“Taylor Swift讲地道中文”等一批由人工智能(AI)翻译软件生成的视频在社交平台引发热议。视频翻译流畅,足可“以假乱真”,刷新了人们对AI应用边界的认知。 如何看待此类视频的“走红”?技术可及性将为生活带来哪些变化?“AI嘴替”又可能涉及哪些法律和伦理风险? 相声演员化身“英语母语者” “还以为他真能说英文相声!”北京“上班族”王路(化名)看到某知名相声演员的表演视频被AI翻译成英文后“十分上头”。更令她感到震撼的是,这些AI合成视频声线拟真、语气自然,甚至口型都能做到“天衣无缝”。 多名视频创作者透露,这项技术来自某款AI视频翻译平台。 用户只需要提交满足要求的初始视频,支付一定订阅费用,即可实现十余种语言的“一键翻译”,呈现自然的克隆声音和真实的说话风格。 基于此技术,一些网络博主尝试翻译自拍VLOG,或对明星的经典片段进行二次创作。视频创作者周天(化名)说,他的工作效率得到很大提升,不仅节省了琐碎的翻译过程,还能拟合原声、改变口型。 人物在不同语言间“丝滑”切换,毫不“违和”,究竟是如何实现的?业内人士表示,看似娱乐的背后,涉及“换脸”“重现”等深度伪造技术,以及大语言模型在多语种翻译方面的应用。 “其实是将相对成熟的各项技术综合了起来。”中科院深圳先进技术研究院研究员燕楠表示,视频制作需要的文字翻译、语音克隆、视频生成等模块,均可由AI轻松完成。例如:人物图像,大模型可直接生成目标人物脸部和嘴部的运动序列,让神情、口型趋于逼真。 技术下放,“尝鲜”AI有风险 “名人说外语”风靡之下,不少人表示看好AI技术在影片译制、文化交流、打破语言壁垒等方面进一步发力。一位提供AI视频翻译帮助服务的中介透露,相比发布“二创”明星素材,针对原创内容翻译出海的咨询近来有所升温。 不仅是专业的内容生产者,从“AI歌手”到可以生成数字分身的小程序,技术门槛的降低,也让越来越多的普通人可以轻松使用AI技术。 那么,如果想“尝鲜”使用AI视频翻译技术,要注意哪些风险? 多位律师表示,从法律层面来说,制作并发布AI翻译视频,可能侵害被模仿者的姓名权、肖像权、名誉权、表演者权等。 “依据《民法典》规定,未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,因此,AI视频翻译可能涉嫌侵犯肖像权。”广东环球经纬律师事务所律师邓鑫说,由于相声、歌曲等源视频均属于著作权法保护的作品范畴,若未经授权使用,还涉嫌著作权侵权。
此外,对声音进行修改和替换,或提取被模仿者的敏感信息,也有相应法律风险。 法律人士指出,如果只是单纯地进行翻译,未将翻译后的生成物公开传播的,一般可以认为是个人的合理使用。 “简单看来挺逗乐,可深入一想,今天被换脸的是‘名人’,明天被换的是自己该怎么办?万一有人利用技术歪曲事实、冒充诈骗,又该怎么办?”互联网上,一些视频弹幕表达了忧虑。“眼见不再为实”,AI视频翻译技术一旦被滥用,后果难以想象。 培育向上向善技术环境 事实上,此前单一维度的AI“换脸”“拟声”已带来一定风险,互联网不是法外之地。截至今年8月初,公安机关通过专项会战,侦破“AI换脸”案件79起,抓获犯罪嫌疑人515名。 知情人士介绍,此类案件的发生,AI技术是手段,关键还要基于大量掌握目标对象的语音图片素材和社会身份信息。
在邓鑫看来,AI技术本身并不是原罪,技术发展带来的后果取决于如何使用、用于何处以及使用代价的考量。 我国已经发布《互联网信息服务深度合成管理规定》与《生成式人工智能服务管理暂行办法》等多项办法,对人工智能相关技术规范、义务主体与责任作出了规定,强调了技术开发、服务提供者的主体责任。 有很多人建议综合施策。专家提示,应该强化对视频制作源头约束、建立平台审核机制,同时,加强深度伪造检测技术研发,通过提取表征等技术方式识别真伪,防止AI滥用。 一些视频发布平台也在积极行动,如上线标识功能,要求创作者发布包含人工智能生成的内容时,应声明“该视频使用人工智能合成技术”,避免误导观众。 业内人士认为,在可以预见的未来,将会有更多有创造力的AI应用案例涌现,社会也应营造向上向善的应用环境,让AI技术真正带来美好。 (新华)