在人類文明和科技迅猛發(fā)展的當(dāng)下,各國(guó)不同種類的語言信息不斷交融,遍及跨境旅游、在線社交、商務(wù)往來、會(huì)議、跨境電商、資訊和輿情監(jiān)測(cè)等行業(yè)領(lǐng)域中,應(yīng)用計(jì)算機(jī)軟件將一種語言自動(dòng)轉(zhuǎn)換為另一種語言的機(jī)器翻譯技術(shù),來滿足各國(guó)多語言信息快速翻譯的需求是目前為有效的手段。
機(jī)器翻譯歷經(jīng)規(guī)則、實(shí)例等方法,已經(jīng)邁入了數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)建模時(shí)代,新的機(jī)器翻譯系統(tǒng)已經(jīng)采用深度學(xué)習(xí)技術(shù),翻譯品質(zhì)大幅度提升,在中文、英語、日語、韓語、俄語等主流語種的翻譯任務(wù)中表現(xiàn)出色,并得到廣泛應(yīng)用。數(shù)據(jù)顯示,超過1000萬人口使用的語言約有60多種,而圍繞“一帶一路”建設(shè),沿線65個(gè)語言就多達(dá)53種。此外,我國(guó)是多民族統(tǒng)一的,不同民族同胞也在使用多種民族語言,機(jī)器翻譯能夠覆蓋這些語種已經(jīng)成為我國(guó)發(fā)展的戰(zhàn)略目標(biāo)和人民生活的迫切需求。
近日,成功入選成為*“2018全國(guó)首批人工智能與實(shí)體經(jīng)濟(jì)深度融合創(chuàng)新項(xiàng)目”的小牛翻譯開放平臺(tái)發(fā)布v2.5版本,支持117個(gè)語言之間任意兩個(gè)語種的相互自動(dòng)翻譯,除中文到116種其它語言互譯的機(jī)翻服務(wù),實(shí)際上總共能提供13572個(gè)語言方向的機(jī)器翻譯能力,且包含維、藏、蒙、哈、朝、彝、壯七個(gè)少數(shù)民族語言,成為目前業(yè)內(nèi)支持語種多的機(jī)器翻譯能力提供商。
實(shí)際上,早在2007年小牛翻譯團(tuán)隊(duì)就開始著手于機(jī)器翻譯的研發(fā)工作。團(tuán)隊(duì)推出的niutrans開源系統(tǒng)是業(yè)內(nèi)成功的兩個(gè)開源機(jī)器翻譯系統(tǒng)之一。迄今,已經(jīng)共享給來自*70多個(gè)3000多家科研機(jī)構(gòu)和企業(yè)使用。niutrans系統(tǒng)也因而獲得了2016年國(guó)內(nèi)中文信息處理領(lǐng)域高科技獎(jiǎng)——錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)一等獎(jiǎng),這也是該獎(jiǎng)項(xiàng)至今一次頒發(fā)給機(jī)器翻譯團(tuán)隊(duì)。此外,小牛翻譯也在wmt2018和國(guó)內(nèi)cwmt2018等機(jī)器翻譯公開評(píng)測(cè)中獲得了多項(xiàng)任務(wù)的*。
小牛翻譯團(tuán)隊(duì)孵化于東北大學(xué)自然語言處理實(shí)驗(yàn)室,由國(guó)內(nèi)機(jī)器翻譯領(lǐng)域?qū)W者姚天順教授創(chuàng)立,至今已有38年歷史,目前由業(yè)內(nèi)機(jī)器翻譯專家朱靖波教授和肖桐博士*。小牛翻譯擁有業(yè)內(nèi)人數(shù)多的機(jī)器翻譯百人研發(fā)團(tuán)隊(duì),其中,碩、博士學(xué)位占比超過80%,完全自主開發(fā)了niulearning深度學(xué)習(xí)框架、niuparser語言分析工具及擁有新基于神經(jīng)機(jī)器翻譯為基本架構(gòu)的niutrans.nmt翻譯系統(tǒng),擁有自主知識(shí)產(chǎn)權(quán),內(nèi)核底層完全自主研發(fā),沒有采用任何第三方開源代碼,具有優(yōu)異的擴(kuò)展和升級(jí)能力。
“區(qū)別于市場(chǎng)中常見的優(yōu)先解決企業(yè)自有業(yè)務(wù)語言轉(zhuǎn)化問題的機(jī)器翻譯服務(wù),小牛翻譯是立足于服務(wù)企業(yè)用戶的機(jī)器翻譯能力提供者,站在用戶角度來思考和打磨機(jī)器翻譯引擎,致力于解決企業(yè)用戶業(yè)務(wù)語言障礙,成為助力推動(dòng)業(yè)務(wù)發(fā)展的‘發(fā)動(dòng)機(jī)’。機(jī)器翻譯,品質(zhì)為王。就像賽車一樣,只有裝配發(fā)動(dòng)機(jī),才有可能獲得比賽勝利。小牛翻譯的初心就是打造品質(zhì)優(yōu)異的多語種機(jī)器翻譯引擎發(fā)動(dòng)機(jī),為合作伙伴輸出專業(yè)的機(jī)器翻譯能力。”小牛翻譯創(chuàng)始人朱靖波說。
研發(fā)者的使命是將技術(shù)變?yōu)閷?shí)用的功能,服務(wù)普通大眾。如何既能滿足系統(tǒng)的穩(wěn)定性和可靠性又能獲得高質(zhì)量的翻譯能力?市場(chǎng)給出的答案是“小牛翻譯”。用戶可以通過公有云服務(wù)api調(diào)用、私有服務(wù)器部署、離線sdk嵌入三種方式獲取機(jī)器翻譯服務(wù)。通過api接口快速接入機(jī)器翻譯能力簡(jiǎn)單方便,提供流量計(jì)費(fèi)模式、資源獨(dú)享、托管式服務(wù),保證用戶的高qps響應(yīng)。
大數(shù)據(jù)時(shí)代,信息安全已成數(shù)字經(jīng)濟(jì)的神經(jīng)系統(tǒng),先扎好信息安全這道“籬笆墻”對(duì)系統(tǒng)研發(fā)而言顯得尤為重要。針對(duì)注重信息安全的用戶,小牛翻譯還可以將翻譯系統(tǒng)部署在用戶的私有服務(wù)器中。配有專業(yè)的技術(shù)團(tuán)隊(duì)和服務(wù)團(tuán)隊(duì),可以在24小時(shí)內(nèi)響應(yīng)用戶需求,提供完善的售前、售后服務(wù),因?yàn)榉g系統(tǒng)完全是自主研發(fā),安全性和穩(wěn)定性都可以滿足用戶需要。還提供硬件(服務(wù)器)+軟件(機(jī)翻系統(tǒng))的服務(wù)模式,節(jié)省用戶采購的時(shí)間成本和人力成本。
的翻譯系統(tǒng),離線翻譯能力是一大亮點(diǎn)。由于機(jī)器翻譯系統(tǒng)使用場(chǎng)景不固定,很多場(chǎng)景由于場(chǎng)地受限,網(wǎng)絡(luò)信號(hào)差,離線翻譯成為一大剛需。把機(jī)器翻譯技術(shù)浸潤(rùn)到實(shí)際應(yīng)用場(chǎng)景中,這一項(xiàng)恰恰是小牛翻譯的優(yōu)勢(shì)。離線版sdk嵌入方式可以幫助用戶將翻譯系統(tǒng)嵌入硬件終端中,小牛翻譯也依靠自有的模型壓縮和cpu加速技術(shù),將原有近2g的機(jī)翻模型,壓縮到只有100m左右,翻譯性能近乎相同于線上引擎,很好地解決了小型終端離線無法應(yīng)用、翻譯速度慢、硬件要求高的問題。
ai加持下的個(gè)性化服務(wù),“量需定制”是方向。目前,小牛翻譯可面向用戶提供vip定制化服務(wù),用戶只需要提供自己領(lǐng)域或場(chǎng)景相關(guān)訓(xùn)練數(shù)據(jù),就能夠幫助用戶做模型訓(xùn)練、部署以及發(fā)布。此外,小牛翻譯還支持二次開發(fā)以及可以自動(dòng)構(gòu)建翻譯系統(tǒng)平臺(tái)等需求,用戶可在自有環(huán)境下進(jìn)行如語料擴(kuò)充、術(shù)語管理等應(yīng)用部署,自主干預(yù)翻譯結(jié)果,幫助用戶定制專有的機(jī)器翻譯引擎。
小牛翻譯希望其ai技術(shù)能夠落地到更多的應(yīng)用場(chǎng)景中。目前,小牛翻譯戰(zhàn)略合作伙伴達(dá)50余家,覆蓋互聯(lián)網(wǎng)服務(wù)、it技術(shù)、語言服務(wù)、知識(shí)產(chǎn)權(quán)、教育、電商、硬件制造等企事業(yè)單位。近年來,也陸續(xù)成為科大訊飛、攜程、騰訊、京東、中國(guó)聯(lián)通等重要合作伙伴,去年被科大訊飛評(píng)為ai能力鉆石團(tuán)隊(duì),是科大訊飛及其合作伙伴*的機(jī)器翻譯能力提供商。
“機(jī)器翻譯,讓世界語言交流無障礙。”是小牛翻譯團(tuán)隊(duì)的美好愿景。未來,小牛翻譯的機(jī)器翻譯模型還將在“多語種、高品質(zhì)、垂直型、個(gè)性化”方向鉆研迭代,小牛翻譯開放平臺(tái)的上線只是他們提供機(jī)器翻譯服務(wù)的開始,后續(xù)將會(huì)有更多能力通過開放平臺(tái)對(duì)外輸出。小牛翻譯將持續(xù)提升翻譯質(zhì)量,保持將新的模型能力對(duì)外更新,為用戶提供好的機(jī)器翻譯“發(fā)動(dòng)機(jī)”。
(原標(biāo)題:支持117個(gè)語種互譯!語種多的機(jī)器翻譯云平臺(tái)上線)