近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機(jī)器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應(yīng)用科技公司)、AFRL(美國空軍研究實(shí)驗(yàn)室)以及KIT(德國卡爾斯魯厄理工學(xué)院)等國際國內(nèi)多個(gè)強(qiáng)勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領(lǐng)域的技術(shù)硬實(shí)力!
表1 IWSLT大賽Baseline Model賽道最終結(jié)果
--取自IWSLT官方公布結(jié):https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
這是搜狗繼WMT 2017機(jī)器翻譯頂級評測大賽奪冠之后,所摘得的又一翻譯領(lǐng)域的技術(shù)桂冠。短期內(nèi)連續(xù)登頂世界第一的位置,充分證明了搜狗在翻譯行業(yè)特別是口語翻譯領(lǐng)域已位居領(lǐng)先地位。
IWSLT是什么比賽?
IWSLT是國際最具影響力的口語機(jī)器翻譯評測比賽,從2004年開始已經(jīng)舉辦了15屆。每屆比賽都吸引了世界各地機(jī)器翻譯領(lǐng)域的知名企業(yè)和研究機(jī)構(gòu)參與,本屆比賽吸引了訊飛、阿里巴巴等國內(nèi)公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學(xué),德國卡爾斯魯厄理工學(xué)院,芬蘭赫爾辛基大學(xué),英國愛丁堡大學(xué),美國AppTek公司等多家國際知名大學(xué)、研究機(jī)構(gòu)和公司參加。
表2 IWSLT2018大賽參賽情況
--取自IWSLT官方公布結(jié)果:
:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
本屆IWSLT 2018的口語機(jī)器翻譯任務(wù)主要評測基于指定數(shù)據(jù)集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個(gè)賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統(tǒng)得到語音識別結(jié)果,之后將結(jié)果送入機(jī)器翻譯系統(tǒng)獲得譯文,這也是業(yè)內(nèi)最主流、效果最好的語音翻譯解決方案,市場上商用機(jī)器同傳、翻譯機(jī)等語音翻譯類產(chǎn)品幾乎都采用了類似的方法;End-to-End則是本次評測新增設(shè)的賽道,主要鼓勵(lì)參賽方探索基于神經(jīng)網(wǎng)絡(luò)的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經(jīng)網(wǎng)絡(luò)模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規(guī)模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓(xùn)練集、測試集相同的情況下,Baseline Model賽道最好的系統(tǒng)取得了28.09的BLEU(機(jī)器翻譯質(zhì)量評價(jià)指標(biāo),值越大代表翻譯質(zhì)量越好),而End-to-End賽道最好的系統(tǒng)僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個(gè)BLEU,差距非常明顯,也證明了Baseline Model賽道評測的算法仍是目前最可行和實(shí)用的解決方案。
搜狗本次參加的是Baseline Model賽道的評測,并取得了第一名的好成績。評測任務(wù)面向TED演講和大會學(xué)術(shù)報(bào)告場景,測試集包括來自英國、歐洲、印度等各個(gè)國家的英語演講者,存在噪聲、口音、自由表達(dá)等復(fù)雜語音現(xiàn)象,同時(shí)語言中存在大量領(lǐng)域?qū)S忻~和口語化的表達(dá)(如:大量語氣詞、錯(cuò)誤語法表達(dá)等),具有極強(qiáng)的實(shí)戰(zhàn)意義和挑戰(zhàn)性。最終,搜狗提交的系統(tǒng)BLEU值達(dá)到28.09,領(lǐng)先排名第二的科大訊飛1.6個(gè)BLEU,證明了搜狗在口語機(jī)器翻譯領(lǐng)域強(qiáng)大的實(shí)力。
AI賽道中持續(xù)發(fā)力,搜狗領(lǐng)跑語音翻譯行業(yè)
搜狗的AI戰(zhàn)略藍(lán)圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅(jiān)持著“自然交互+知識計(jì)算”的人工智能核心方向,并持續(xù)深耕技術(shù),推動(dòng)技術(shù)向產(chǎn)品的快速轉(zhuǎn)化,2016年,搜狗發(fā)布了自有人機(jī)交互解決方案-知音引擎。擁有充足真實(shí)語料數(shù)據(jù)優(yōu)勢的搜狗,將語音識別與機(jī)器翻譯技術(shù)相結(jié)合,并在2016年推出了全球首款商用AI同傳系統(tǒng)-搜狗同傳,引領(lǐng)了語音翻譯技術(shù)的普及與應(yīng)用。通過數(shù)百場的國際會議“實(shí)戰(zhàn)”,搜狗同傳獲得了無數(shù)媒體和觀眾的好評,成為當(dāng)下炙手可熱的“AI字幕君”。
與此同時(shí),搜狗也推出了一系列的智能硬件,將語音翻譯技術(shù)應(yīng)用到了更廣闊的場景之中,幫助用戶打破了跨國交流時(shí)的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動(dòng),在朋友圈里大打廣告。作為首款智能翻譯硬件,它支持42種語言對話翻譯,解決了旅游場景中用戶聽不懂、看不懂、不會說等真實(shí)痛點(diǎn)。該項(xiàng)產(chǎn)品在京東平臺首發(fā)當(dāng)日即告售罄,首日銷售額破千萬。與此同時(shí),搜狗還推出了錄音翻譯筆,提供錄音轉(zhuǎn)寫、對話翻譯、同聲傳譯等功能,把AI同傳落地到了消費(fèi)級產(chǎn)品之中,開拓了語音翻譯的新航道。
眾所周知,人工智能是未來科技的風(fēng)向標(biāo)。通過這次在IWSLT比賽中的優(yōu)秀成績,可以看到以搜狗為代表的國產(chǎn)科技巨頭企業(yè),已表現(xiàn)出了引領(lǐng)行業(yè)的技術(shù)硬實(shí)力。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時(shí),外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績才勉強(qiáng)過一本線,今年集體晉升985。據(jù)悉,豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎,中小AI創(chuàng)企的處境卻日益尷尬
文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報(bào)志愿。今年,這一領(lǐng)域迎來了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報(bào)市場付費(fèi)規(guī)模約9.5億元,近九成考生愿意借助志愿填報(bào)服
蘋果還沒從WWDC25的“群嘲”中走出,又迎來了一次新的痛擊。據(jù)路透社報(bào)道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語音助手Siri所需的時(shí)間,導(dǎo)致iPhone銷量受影響、股價(jià)下滑,構(gòu)成證券欺詐。在這份訴訟中,庫克、首席財(cái)務(wù)官凱文·帕雷克及前首席財(cái)務(wù)官盧卡·馬埃
華為的盤古大模型終于推出新版本了。6月20日華為云計(jì)算CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,盤古大模型5.5同步發(fā)布。不過,當(dāng)前國內(nèi)的AI大模型競爭可謂是相當(dāng)激烈,華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從
一場沒有羅永浩的“羅永浩直播”,正在改寫帶貨規(guī)則當(dāng)數(shù)字人羅永浩在百度直播間舉起青島啤酒,以標(biāo)志性幽默回應(yīng)粉絲提問時(shí),彈幕瘋狂刷出“這是真的還是假的?”的疑問。這場持續(xù)近7小時(shí)的直播,創(chuàng)下1300萬人次觀看、GMV突破5500萬元的驚人戰(zhàn)績,甚至超過了他本人一個(gè)月前真人直播5000萬元的成績。數(shù)字人主
高頻互動(dòng)、個(gè)性化教學(xué)、突破成本壁壘,AI老師讓英語學(xué)習(xí)更普惠。6月24日,新東方正式推出面向消費(fèi)者的首款原創(chuàng)AI教育產(chǎn)品——“新東方AI1對1”。這款產(chǎn)品標(biāo)志著新東方在教育+AI戰(zhàn)略布局中邁出關(guān)鍵一步,旨在以科技力量推動(dòng)優(yōu)質(zhì)教育資源的普惠發(fā)展。在發(fā)布會現(xiàn)場,新東方教育科技集團(tuán)CEO周成剛表示:“AI
大家好,我是白楊SEO,專注SEO十年以上,全網(wǎng)SEO流量實(shí)戰(zhàn)派,AI搜索優(yōu)化研究者。為什么想分享這個(gè)AI工作流及coze扣子這個(gè)?因?yàn)槲覀兏懔髁康娜绻麑W(xué)會了用AI給我們生產(chǎn)提效將更有助于我們?nèi)カ@客。目前白楊SEO用得并不是很好,分享僅供參考,希望給你一些啟發(fā)。老規(guī)矩,先說下文章大綱如下:1、AI工
近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發(fā)熱潮。今年3月,被業(yè)內(nèi)稱作“英偉達(dá)親兒子”的AI基礎(chǔ)設(shè)施企業(yè)CoreWeave上市。這家依托英偉達(dá)GPU資源沖擊新云市場的初創(chuàng)公司,上市不到3個(gè)月市值飆升359%,達(dá)881億美元。CoreWeave的“身價(jià)暴漲”吸引了無數(shù)視線。對此,不少