Mozilla使用開源Common Voice語音識別數(shù)據(jù)集進(jìn)行多語言操作
2018-06-08 08:02:41
Mozilla宣布它正在擴(kuò)大其眾包的Common Voice項目 - 一項旨在創(chuàng)建開源語音識別數(shù)據(jù)集的舉措 - 包括更多語言。
該技術(shù)組織于去年6月首次發(fā)布Common Voice,邀請來自世界各地的志愿者通過網(wǎng)絡(luò)和移動應(yīng)用程序,用他們的聲音記錄文本片段 。
上圖:記錄你的聲音

該項目與亞馬遜,谷歌,蘋果和微軟等正在開發(fā)的專有語音識別技術(shù)的不斷增長的軍火庫相反。上述巨頭正在大力投資于語音激活數(shù)字助理Alexa,谷歌助理,Siri和Cortana,但各自的數(shù)據(jù)集均由公司自己擁有。
Mozilla 于11月推出了英語Common Voice數(shù)據(jù)集的第一批成果,收錄了大約500小時的演講,并從20000個人中構(gòu)建了40萬個錄音。今天,Mozilla 正式開始收集另外三種語言的語音數(shù)據(jù) - 法語,德語和 - 隨機(jī) - 威爾士語 - 的過程。目前正在為數(shù)據(jù)收集過程準(zhǔn)備另外40種語言,巴西葡萄牙語,中國(臺灣),印度尼西亞語,波蘭語和荷蘭語等國家已經(jīng)準(zhǔn)備好啟動眾包語音數(shù)據(jù)。
下一個大平臺
多年來,語音將成為技術(shù)的下一個重要平臺。就在昨天,亞馬遜正式推出了新款相機(jī)注入,Alexa供電的Echo Look智能揚(yáng)聲器,告訴你應(yīng)該穿什么樣的衣服。我們?nèi)匀惶幱谶@場運(yùn)動的早期階段,但顯然聲音只會變得更加普遍。
正是在這種背景下,Mozilla正在推進(jìn)創(chuàng)建開源數(shù)據(jù)集的計劃,任何人都可以自由使用這些數(shù)據(jù)集來將語音識別智能構(gòu)建到各種應(yīng)用程序和服務(wù)中。
Mozilla首席創(chuàng)新官Katharina Borchert表示:“我們相信這些接口不應(yīng)該由少數(shù)幾家公司作為守門員來控制語音服務(wù),并且我們希望用戶能夠以他們自己的語言和口音持續(xù)理解用戶,”Mozilla首席創(chuàng)新官Katharina Borchert說。博客帖子。
Common Voice項目的用途類似于其他用于打擊私人平臺的開放許可證項目。OpenStreetMap 是類似眾包項目的一個很好的例子,該項目為開發(fā)人員提供開放且可自由使用的世界地圖,而無需谷歌地圖等競爭對手服務(wù)的成本或限制。
在可訪問性方面,英語可能在很多方面成為互聯(lián)網(wǎng)的通用語,但事實是大多數(shù)人會說英語以外的語言作為他們的母語。隨著語音識別AI革命的興起,為開發(fā)機(jī)器學(xué)習(xí)模型提供開發(fā)人員和技術(shù)人員多語言數(shù)據(jù)集的任何事情都只能是一件好事。
“使用多種語言標(biāo)志著Common Voice邁出了重要的一步,我們希望這對于整體語音技術(shù)來說也是一大步,” Mozilla Common Voice項目的數(shù)字策略師Michael Henretty 補(bǔ)充道。“語音技術(shù)的民主化不僅會降低全球創(chuàng)新的障礙,而且也是獲取信息的障礙?!?/span>