现在不少视频里会使用AI也就是人工智能生成声音,随着AI技术的普及,只要提取一个人足够的声音样本,就能“克隆”出他的声音,制作出AI人声产品。
技术的更新也给声音权益的保护带来挑战。4月23日,全国首例“AI生成声音人格权侵权案”在北京互联网法院一审宣判。□央视
自己的声音AI化了?
AI声音的样本原型来自殷女士,她是一名配音师,录制过不少作品。令殷女士感到奇怪的是,她从没有授权过任何人或公司将自己的声音AI化,也就是用人工智能的方式生成,但一些短视频平台用户发布的视频中,使用的却是基于她的声音制作的AI配音。
“首先发现的其实是我们同行,他是在刷小视频的时候,发现一些电影的解说和游戏的解说用了我的AI声音。”殷女士说。
是谁把自己的声音AI化了?这些AI声音又是怎么传播开的呢?
殷女士花了一番功夫,发现了她的AI声音商品化的过程。原来,殷女士曾和一家文化传媒公司合作,录制了几部有声读物。之后,这家文化传媒公司将这些录音制品提供给了一家软件公司。
该软件公司以殷女士录制的作品为素材,进行了AI化处理,生成了一款文本转语音产品并通过经销商对外出售。最终,运营智能配音软件的科技公司采购了这款产品,在未经任何技术处理的情况下,直接调取并生成了文本转语音产品,并在软件平台上销售。
殷女士认为自己的声音权益受到了侵害,于是将运营智能配音软件的某科技公司、将自己的录音制品转手他人的某文化传媒公司、将声音AI化的某软件公司,以及两家经销商起诉至北京互联网法院,要求某科技公司、某软件公司停止侵权、赔礼道歉,并由被告赔偿其经济损失、精神损失共计60万元。
声音具有人格属性
“我们都有一句常听的话,就是未见其人先闻其声。这个也反映出来声音往往能够联想到一个人,所以说声音的这种标志性是非常明晰的。声音权益是民法典新增加的标表型的一种人格权。”北京互联网法院副院长赵瑞罡表示,《中华人民共和国民法典》第一千零二十三条规定,对自然人声音的保护,参照适用肖像权保护的有关规定。从法理上看,声音权益属于人格权的一部分,并且声音权益受到保护的前提是具有“可识别性”。庭审中,有被告认为,原告的AI化声音并不具备这一特点。
法院审理认为,利用人工智能合成的声音,如果一般社会公众或者相关领域的公众根据其音色、语调和发音风格,能够关联到该自然人,可以认定为具有可识别性。
本案的另一个焦点问题在于,被告某文化传媒公司、某软件公司是否拥有原告殷女士声音的合法授权呢?两被告均认为,他们已获得案涉声音的授权,不存在任何侵权的主观过错。
对此,原告方认为,不应以被告拥有殷女士关于著作权的授权,当然地推定为人格权的授权。
原告一审获赔25万元
法院审理认为,本案中,被告某文化传媒公司对录音制品享有著作权等权利,但不包括授权他人对原告声音进行AI化使用的权利。被告某文化传媒公司与被告某软件公司签订数据协议,在未经原告本人知情同意的情况下,授权被告某软件公司AI化使用原告声音的行为无合法权利来源。
法院审理认为,被告某文化传媒公司、某软件公司未经原告许可使用了原告声音,构成对原告声音权益的侵犯,其侵权行为造成了原告声音权益受损的后果,应承担相应的法律责任。其余被告主观上不存在过错,不承担损害赔偿责任。法院综合考量被告侵权情节、同类市场产品价值、产品播放量等因素,对损害赔偿予以酌定。
2024年4月23日,北京互联网法院对案件作出判决。被告某科技公司、被告某软件公司向原告赔礼道歉,被告某文化传媒公司、被告某软件公司向原告赔偿经济损失25万元。