近日,微軟宣布其Azure認(rèn)知服務(wù)翻譯的語(yǔ)言列表又添加了12種全新的語(yǔ)種和方言。至此,微軟翻譯可以提供翻譯支持的語(yǔ)言總數(shù)已達(dá)103種。新增語(yǔ)言的母語(yǔ)使用者合計(jì)達(dá)8460萬(wàn)人。目前,最新版的微軟翻譯可以在全球56.6億人所使用的不同母語(yǔ)之間實(shí)現(xiàn)文本文檔的互譯。
微軟研究院在20多年前首次開(kāi)發(fā)出機(jī)器翻譯系統(tǒng)。此后,微軟以統(tǒng)計(jì)機(jī)器翻譯模型為基礎(chǔ),對(duì)系統(tǒng)做了進(jìn)一步改良。隨著人工智能技術(shù)的發(fā)展,微軟研究院開(kāi)始采用神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),將所有機(jī)器翻譯系統(tǒng)遷移到基于Transformer架構(gòu)的神經(jīng)網(wǎng)絡(luò)模型上,因此翻譯的流暢度和準(zhǔn)確性獲得了大幅提升。
盡管如此,缺少足夠的平行語(yǔ)料依然是小語(yǔ)種語(yǔ)言翻譯的最大難點(diǎn)。多年來(lái),微軟亞洲研究院承擔(dān)了多個(gè)小語(yǔ)種語(yǔ)言和方言的模型構(gòu)建工作,將新技術(shù)融入其中,幫助解決語(yǔ)料問(wèn)題。微軟亞洲研究院首席研究員秦濤表示:“基于源語(yǔ)言和目標(biāo)語(yǔ)言的平行語(yǔ)料及單語(yǔ)語(yǔ)料,我們?cè)谟?xùn)練階段將多語(yǔ)言模型與MASS預(yù)訓(xùn)練模型相結(jié)合,同時(shí)再利用相關(guān)大語(yǔ)種的豐富語(yǔ)料及單語(yǔ)語(yǔ)料來(lái)提升模型的翻譯質(zhì)量。”
Azure認(rèn)知服務(wù)中的翻譯工具由微軟翻譯提供支持,旨在幫助企業(yè)擴(kuò)大其全球影響力,讓他們能夠快速、可靠并以合理的成本跨越語(yǔ)言障礙,用客戶的母語(yǔ)與之進(jìn)行合作、交流并提供內(nèi)容服務(wù)。為了實(shí)現(xiàn)音頻或語(yǔ)音內(nèi)容的翻譯,Azure認(rèn)知服務(wù)的翻譯工具和語(yǔ)音工具緊密集成,通過(guò)Azure語(yǔ)音SDK為語(yǔ)音翻譯和多設(shè)備對(duì)話提供支持。(苗琳)