首頁 人工智能

AI語音真假面:你的“聲音DNA”可能會被復制

 

皇冠会员登入如果有一種技術可以一秒復制或模仿你講話,你會感到驚喜還是驚恐?

皇冠会员登入進入2019年,AI技術的應用落地越來越多樣化。科大訊飛、搜狗等技術公司相繼發布了語音合成技術的應用。通過AI手段,用戶可以一秒變聲社會名人或者其他想模仿的聲音。

皇冠会员登入互聯網技術在悄無聲息地改變我們的生活,對人工智能企業來說,語音識別技術的廣泛應用已不是難事。但背后的倫理道德和安全隱患,或將成為伴隨AI技術發展不容忽視的一個問題。

實時變聲技術受AI公司熱捧 一秒可換聲

“嗨,大家好,今天非常開心,來到科大訊飛新品發布會,一直好喜歡科大訊飛哦……”

這是發生在科大訊飛2019新品發布會上的一幕,科大訊飛董事長劉慶峰通過技術,現場模擬了單田芳、林志玲和羅永浩的聲音來做開場白。尤其當羅永浩聲音響起的時候,不少人以為老羅到了現場。

“你看到的是劉慶峰,但聽到的是老羅的聲音。”臺上的劉慶峰表示,這是公司最新的實時變聲技術。據悉,這項新的語音合成技術只需要1分鐘的聲音樣本,就可以模仿任何人說話。

不止科大訊飛,也是在近期,搜狗CEO王小川在一場大會上展示了搜狗變聲功能,通過手機軟件,王小川模擬了高曉松和東北妹子的聲音,引得現場連連發笑。他隨后展示了歌曲中的聲音替換,據介紹,系統先用14分鐘對他的語音做了訓練,然后把音色做遷移。

這是搜狗最新的語音合成技術,可以實現把任何人的聲音轉化成特定聲音,秒變林志玲、馬云的聲音都可以。王小川表示,這不只是一個簡單的語音合成,可以把語音語調情感做遷移。

目前,在搜狗輸入法中,用戶可以將自己的聲音自由變換成喜歡的聲音,在微信、QQ、陌陌等主要社交場景均可使用。搜狗提供了明星、卡通人物、游戲 IP、方言等幾個類別供19種特定聲音。

王小川

王小川

皇冠会员登入其實,語音合成早就不是新技術,之前,我們見到更多的是將文字轉化為聲音,比如在導航、轉寫、智能音箱、Siri等智能語音助手等方面的應用,并不是真人在說話。

皇冠会员登入今年,很多AI公司發力語音合成在變聲、語音cos等場景下的應用,將真人發出的聲音轉化成特定聲音。

百度也有相關技術的落地應用,今年5月初,在中央電視臺公益節目《等著我》中,百度大腦基于智能語音技術,合成了已故老兵的聲音,幫助分別64年的老戰友實現“重逢”。

據介紹,該技術使用百度端到端語音風格分離和建模方案,使用多組神經網絡對語音的不同維度,例如音色、情感、風格等,進行獨立的編碼建模,從而指導最終合成。

這些AI技術落地應用的背后,一方面體現了AI技術應用的進展,和為社會帶來的普惠價值理念。比如搜狗將語音變聲技術、AI合成主播技術等與行業結合,在媒體、教育、內容制作、旅游等場景結合,將會帶來更大的價值想象空間。

皇冠会员登入另一方面,未來可能存在的技術漏洞、技術濫用等風險也不容忽視。有網友就指出“小心被用于電信詐騙”“以后可能會收到‘馬云’的電話”……

皇冠会员登入一音頻領域業內人士認為,對于音頻作為交互方式的工具型產品應該是有用的,但對于音頻作為內容載體的線上音頻平臺,正面意義有待觀察。

皇冠会员登入因此,對企業來說,在不斷尋求技術突破和商業價值的同時,也應該樹立對技術安全的責任心。

官方微博/微信

皇冠会员登入每日頭條、業界資訊、熱點資訊、八卦爆料,全天跟蹤微博播報。各種爆料、內幕、花邊、資訊一網打盡。百萬互聯網粉絲互動參與,TechWeb官方微博期待您的關注。

↑掃描二維碼

想在手機上看科技資訊和科技八卦嗎?

想第一時間看獨家爆料和深度報道嗎?

請關注TechWeb官方微信公眾帳號:

1.用手機掃左側二維碼;

2.在添加朋友里,搜索關注TechWeb。

為您推薦

手機游戲更多