來源:新智元 時間:2019-01-11 13:54:07 作者:金磊
【導讀】剛剛開幕的CES 2019,科大訊飛帶著升級后的訊飛翻譯機,訊飛聽見轉寫系列產(chǎn)品以及最新產(chǎn)品訊飛智能錄音筆、訊飛智能辦公本出席,并再一次獲得CES創(chuàng)新獎。而在生態(tài)建設上,訊飛吸引了92萬開發(fā)者,交出了一份讓人滿意的答卷。本次,中國聲谷的合作伙伴們也在訊飛展區(qū)上聯(lián)合展出。
說話,是世界上最簡單的事情。我們在學會讀書認字之前,就已經(jīng)可以很輕松的向別人表達自己的想法。說話,又是世界上最不簡單的事情。不同國家之間言語不通,不同的省份地區(qū)也有著各自的方言。一個人想要精通兩門語言是困難的,而一個人想精通50門語言,基本上是不可能的。別說人,就是對于人工智能而言,精通51門語言也不是一件容易的事情。感謝人工智能,讓這個不可能,變成可能。
支持近200個國家和地區(qū)語言即時翻譯,準確率超過95%,速度不過0.6秒
2018年,NLP的算法和模型的蓬勃發(fā)展,可以說是跑步上了好幾個臺階。得益于人工智能在自然語言、圖像文字識別的發(fā)展,多語種即時互譯、拍照翻譯等技術,有了飛躍式的提升。正在賭城拉斯維加斯舉行的CES展上,科大訊飛通過升級版的訊飛翻譯機,向我們展示了目前在NLP技術落地應用方面,已經(jīng)可以做到怎樣的程度。??
升級前后性能對比
訊飛翻譯機利用了神經(jīng)網(wǎng)絡機器翻譯、語音識別、語音合成、圖像識別、離線翻譯以及四麥克風陣列等多項人工智能技術,實現(xiàn)了中文與50種語言即時互譯。即使在沒有網(wǎng)絡的情況下,訊飛翻譯機仍然可以實現(xiàn)中文與英/俄/日/韓等語言的離線翻譯。在文字識別方面,可以實現(xiàn)拍照翻譯。
除了50種外語之外,訊飛翻譯機還支持方言翻譯?,F(xiàn)已經(jīng)支持四川話、東北話、河南話、粵語和英語,以及中文和粵語的即時互譯。所以一只訊飛翻譯機在手,已經(jīng)可以覆蓋200多個國家和地區(qū)的出行需求。
除此以外,訊飛翻譯機還自建全球化服務節(jié)點,全球各國家地區(qū)語音翻譯平均響應時長縮短至600ms,實現(xiàn)了松手即聽翻譯結果。憑借著產(chǎn)品和性能的雙重優(yōu)勢,訊飛翻譯機上市至今持續(xù)保持市場份額第一,并在本屆大會上,再次獲得CES創(chuàng)新獎。
如果不能區(qū)分專業(yè)語境,數(shù)量、速度和準確率就失去了意義
除了日常交流,平時我們接觸最多的其實還是專業(yè)領域之間翻譯。比如同一個英文縮寫,在不同專業(yè)語境下,所表達的意思往往截然不同。例如 His SUV is very abnormal 這句英語。如果作為通用場景下的日常交流,那么它所表達的意思是 他的越野車很不正常。但如果這句話放在醫(yī)療行業(yè)的語境下,則變成了他的標準化攝取值很不正常。如果不能區(qū)分專業(yè)語境,那么數(shù)量和準確率就失去了意義。針對這個問題,科大訊飛首發(fā)行業(yè)AI翻譯,覆蓋醫(yī)療、金融、計算機三大行業(yè),能實現(xiàn)專業(yè)詞句在指定行業(yè)下的精準翻譯,從而解決了這三類行業(yè)從業(yè)者,在內(nèi)容翻譯上的痛點。
僅僅在2018年,訊飛就在包括SQuAD、SemEval、MTWI、CGED、CHiME-5、IWSLT、2018 TREC…在內(nèi)的國際國內(nèi)頂級大賽中,獲得了12項語音和人工智能相關獎項的世界第一。但是技術層面可以輕松做到的事情,在落地應用的時候經(jīng)常會面臨各種問題。實驗室的環(huán)境是非常純粹和理想的,而現(xiàn)實場景充滿了各種不確定因素。能在比賽中拿世界第一,并不代表一定就能做出能用的產(chǎn)品。
工具性產(chǎn)品最大的價值在于提高效率
好的產(chǎn)品,需要從幾個維度來綜合衡量。技術實現(xiàn)并不是好產(chǎn)品的唯一條件,單純只考慮技術,反而可能會跟實際應用場景脫節(jié)。
工具性的產(chǎn)品,它的價值體現(xiàn)在兩個方面:
1、解決用戶需求
2、提高效率
實際場景中,我們對語音類工具的需求也是多方面的。比如作為記者,痛點之一就是采訪錄音的整理,所以記者的需求會包括以下幾個:
1、良好的錄音質(zhì)量;快速的語音轉文字
2、結實的質(zhì)量;小巧的機身
3、超長待機;輕松導出
商務人士,或者去參加學術會議的學者,需要能夠將會議上的重要演講,及時的記錄下來并轉化成文字。為了滿足不同用戶在不同應用場景下的需求,科大訊飛同時也推出了多款產(chǎn)品,亮相CES。
訊飛智能錄音筆和訊飛智能辦公本,是訊飛推出的兩款新產(chǎn)品,主要針對會議場景。新產(chǎn)品的實時轉寫功能,能夠極大的提升用戶的工作效率。新智元駐CES前方記者傳來了兩張動圖,讀者朋友可以來感受一下語音轉文字、并且中英實時互譯的效果。
語音即時轉文字
中英實時互譯
根據(jù)訊飛內(nèi)部消息透露,目前訊飛智能錄音筆還未正式開售,最快要到今年4月份才會上市。
訊飛智能辦公本同樣是一款神器。采用了新智元記者非常喜歡的墨水屏設計,能夠給獲得最接近紙的視覺體驗,并且長時間使用,眼睛也不易疲勞。
訊飛智能辦公本不僅可以實時轉寫,同時還允許用戶使用觸控筆進行寫畫操作,這才是這款辦公本最亮點的地方。相當于一邊看著有字幕的電影,一邊還拿著小本子劃重點,效率一下子就提升了好幾個等級。
探索將技術轉化為在不同場景下,解決用戶需求的應用
基于智能硬件開放平臺,訊飛AI技術得以賦能在智能硬件單品、物聯(lián)網(wǎng)和智能家居等場景。人工智能技術的一大難點就是落地應用。技術是越飛越高了,在落地方面就差了很多??拼笥嶏w利用自己的技術,做出多款產(chǎn)品,探索從技術??應用的可能性。
以下產(chǎn)品是訊飛今年CES上展出的解決不同使用場景需求的產(chǎn)品。
阿爾法蛋
阿爾法蛋是訊飛針對兒童教育市場推出的一款互動陪護機器人。它集教育內(nèi)容、超級電視、視頻通話、智能音箱和自然語音交互等功能為一體,為家長和孩子搭建起一個橋梁。
訊飛聽見
訊飛聽見智能會議系統(tǒng)2.0支持中文、英文語音實時轉寫成文字,同時可提供中英互譯功能,其中中文語音轉寫準確率可達95%。速度也非常快,會議結束時就已經(jīng)能夠將演講者的語音轉換成文字,用戶可以直接導出文稿內(nèi)容,極大的提高了文字整理的效率。根據(jù)新智元記者多次參會的實際體驗,確實可以稱得上又快又準。在演講嘉賓帶有各種方言口音的普通話場景下,依然能夠準備的實時轉成文字。除了在大型會議上的應用,科大訊飛還于2018年10月24日發(fā)布了針對C端的會議轉寫產(chǎn)品,訊飛聽見M1轉寫助手。
訊飛聽見M1轉寫助手雖然只有10g,半個巴掌大小,但是搭載訊飛7+1環(huán)形麥克風陣列、遠場拾音芯片等技術,可實現(xiàn)10米以內(nèi)的高品質(zhì)降噪無損錄音,搭配訊飛聽見APP使用,為像新智元記者這樣的文字工作者帶來更多便利。
莫比斯耳機
莫比斯耳機對于訊飛來說,也是一款順理成章的產(chǎn)品。擁有智能的操作方式和交互響應,功能覆蓋出行導航、語音操控、音樂聽書、心率監(jiān)測等方面。
更多產(chǎn)品
訊飛魔飛MORFEI2.0智能麥克風
訊飛麥克風陣列、最新模塊WIFISOC201等硬件
有生態(tài)才能有開發(fā)者,有開發(fā)者平臺才能跑的遠
很明顯,未來的競爭就是生態(tài)的競爭。建立生態(tài),招募開發(fā)者,才能讓技術得以煥發(fā)最強大的生命力,才能讓平臺變大變強,走的更遠。在過去的一年中,訊飛積極發(fā)展開放平臺建設,取得了非常矚目的成績:
開發(fā)者數(shù)量從50萬增長到92萬
總應用數(shù)達57.7萬
累計終端用戶數(shù)22億
日均服務量達47億次
AI大學學員總量26.21萬
平臺提供的AI能力從67項增長到了170+項
訊飛的語音交互系統(tǒng)iFLYOS已在2018年內(nèi)測完畢,將在2019年全新上線。
屆時,開發(fā)者將迎來一個軟硬一體、服務連接、自由度高、與其他語音交互類產(chǎn)品不同的iFLYOS語音交互系統(tǒng)。
基于科大訊飛最先進的語音技術,鏈接優(yōu)秀的軟硬件合作伙伴,為智能語音產(chǎn)品生態(tài)提供可自主定制的解決方案。正如科大訊飛副總裁李傳剛博士所說:“A.I.+時代不僅是從業(yè)者的時代,更是每個人的新時代?!笨拼笥嶏w將不斷推動技術創(chuàng)新和產(chǎn)品創(chuàng)新,為消費者創(chuàng)造價值,與合作伙伴共同前行。
責任編輯:李蘭松