橡膠止水帶@百度為2019語言與智能技術(shù)競(jìng)賽添磚加瓦!
橡膠止水帶@百度為2019語言與智能技術(shù)競(jìng)賽添磚加瓦!由計(jì)算機(jī)學(xué)會(huì)(CCF)和中文信息學(xué)會(huì)(CIPS)聯(lián)合主辦,百度公司、計(jì)算機(jī)學(xué)會(huì)中文信息技術(shù)專委會(huì)和中文信息學(xué)會(huì)評(píng)測(cè)工作委員會(huì)聯(lián)合承辦的“2019語言與智能技術(shù)競(jìng)賽”于2月25日啟動(dòng)報(bào)名之后,得到了海內(nèi)外AI研發(fā)者的積極響應(yīng)。截至3月21日,已有全球1669支隊(duì)伍和個(gè)人注冊(cè)報(bào)名,目前競(jìng)賽仍在火熱報(bào)名中。報(bào)名通道將于3月31日關(guān)閉,同時(shí)將對(duì)報(bào)名者開放全部訓(xùn)練數(shù)據(jù),歡迎登錄競(jìng)賽官網(wǎng)進(jìn)行報(bào)名和下載。本次競(jìng)賽獲勝團(tuán)隊(duì)將分享總額達(dá)27萬的獎(jiǎng)金,并將在第四屆“語言與智能高峰論壇”進(jìn)行頒獎(jiǎng)。誠(chéng)邀全球AI人才報(bào)名參加本次競(jìng)賽。
報(bào)名的1669隊(duì)伍中,有767支來自192所高校和科研院所的年輕隊(duì)伍,占比超過52%。據(jù)統(tǒng)計(jì)信息,全國(guó)211高校中70%的高校有研究團(tuán)隊(duì)報(bào)名參賽,成為參賽隊(duì)伍的主力。值得一提的是,參賽的隊(duì)伍覆蓋了20多所海外知名院校,分別來自美國(guó)、加拿大、英國(guó)、澳大利亞、荷蘭、日本等8個(gè)。除此以外,有357支參賽隊(duì)伍來自微軟、騰訊、華為、阿里巴巴、移動(dòng)、工商銀行等226家知名企業(yè),涉及科研領(lǐng)域及互聯(lián)網(wǎng)、數(shù)碼3C、金融、通訊、家電等多個(gè)垂直行業(yè)。
本屆競(jìng)賽設(shè)立了三個(gè)任務(wù),包括機(jī)器閱讀理解、知識(shí)驅(qū)動(dòng)對(duì)話和信息抽取,為全球開發(fā)者提供了具有挑戰(zhàn)性的競(jìng)技舞臺(tái)。。其中,機(jī)器閱讀理解任務(wù)是“2018機(jī)器閱讀理解技術(shù)競(jìng)賽”的延伸,今年任務(wù)設(shè)置上更有挑戰(zhàn)性。
百度公司作為本次競(jìng)賽承辦方,為選手提供了全面的技術(shù)及資源支持,三大任務(wù)上,百度分別開發(fā)了的、基于深度學(xué)習(xí)框架的開源基線模型,幫助選手快速進(jìn)入開發(fā)工作,大幅提升參賽效率。

其中,機(jī)器閱讀理解任務(wù)提供了基于BiDAF的模型作為基線系統(tǒng)。BiDAF是基于LSTM以及注意力機(jī)制的經(jīng)典閱讀理解模型,在多項(xiàng)閱讀理解任務(wù)上均表現(xiàn)良好。在2018機(jī)器閱讀理解技術(shù)競(jìng)賽中,超過80%的參賽選手都基于BiDAF基線進(jìn)行開發(fā),取得了優(yōu)異的競(jìng)賽成績(jī)。值得一提的是,本屆競(jìng)賽專門針對(duì)基于PaddlePaddle版本的BiDAF基線進(jìn)行了升級(jí),加入段落抽取模塊擴(kuò)大召回,并利用先驗(yàn)概率分布進(jìn)行段落排序,顯著提升了模型效果。升級(jí)后的PaddlePaddle版本BiDAF基線效果可以進(jìn)入去年競(jìng)賽前十名。此外,參賽選手還將獲得已訓(xùn)練好的模型參數(shù),從而更有效地進(jìn)行開發(fā)。
知識(shí)驅(qū)動(dòng)對(duì)話任務(wù)則提供了檢索和生成的兩種基線模型,這是目前對(duì)話技術(shù)中主流的兩個(gè)技術(shù)線條。檢索模型使用了目前學(xué)術(shù)界前沿的的BERT技術(shù),針對(duì)對(duì)話上下文和候選回復(fù)進(jìn)行表示,在生成模型中使用Memory Network進(jìn)行知識(shí)表示,并創(chuàng)新性的提出了使用后驗(yàn)信息(回復(fù)中使用的知識(shí)信息)指導(dǎo)模型知識(shí)選擇策略的學(xué)習(xí),效果上顯著超越基準(zhǔn)模型。
信息抽取任務(wù)提供的是業(yè)界主流的pipeline解決方案,其創(chuàng)新性地提出行關(guān)系分類,再進(jìn)行實(shí)體標(biāo)注的pipeline結(jié)構(gòu),即先基于深層堆疊雙向LSTM網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行多標(biāo)簽關(guān)系分類,再依據(jù)關(guān)系類型采用深層堆疊雙向LSTM-CRF序列標(biāo)注模型進(jìn)行subject、object的實(shí)體論元標(biāo)注,高效解決了重疊實(shí)體的關(guān)系抽取問題,顯著提升模型準(zhǔn)召效果,可以更好地為選手開發(fā)服務(wù)。
基線版本上,本次比賽同時(shí)提供了閱讀理解、信息抽取任務(wù)的PaddlePaddle版基線模型,以及基于檢索實(shí)現(xiàn)的知識(shí)驅(qū)動(dòng)對(duì)話任務(wù)PaddlePaddle基線模型,基于生成實(shí)現(xiàn)的PaddlePaddle版基線模型將于近期發(fā)布。PaddlePaddle是百度研發(fā)的開源開放的深度學(xué)習(xí)平臺(tái),是早開源、也是當(dāng)前一個(gè)功能完備的深度學(xué)習(xí)平臺(tái),具有簡(jiǎn)潔、穩(wěn)定、訓(xùn)練和預(yù)測(cè)速度快等特點(diǎn)。依托百度業(yè)務(wù)場(chǎng)景的長(zhǎng)期錘煉,PaddlePaddle有全面的官方支持的工業(yè)級(jí)應(yīng)用模型,涵蓋自然語言處理、計(jì)算機(jī)視覺、推薦引擎等多個(gè)領(lǐng)域,并開放多個(gè)的預(yù)訓(xùn)練中文模型,以及多個(gè)在范圍內(nèi)取得競(jìng)賽的算法模型。
資源上,百度將在AI Studio平臺(tái)上為參賽選手免費(fèi)提供GPU集群計(jì)算資源,并預(yù)置PaddlePaddle版本基線。AI Studio是百度深度學(xué)習(xí)一站式開發(fā)平臺(tái),集成了PaddlePaddle開發(fā)環(huán)境、數(shù)據(jù)集和免費(fèi)算力資源。參賽者借助AI Studio的平臺(tái)資源和預(yù)置PaddlePaddle基線,可快速進(jìn)入模型訓(xùn)練階段,達(dá)到事半功倍的效果。
作為本屆競(jìng)賽的承辦方,百度不僅為參賽選手提供了三大任務(wù)開源基線系統(tǒng),也開放了大規(guī)模標(biāo)注的中文數(shù)據(jù)集。百度對(duì)于人工智能研發(fā)一直秉承“開放賦能、生態(tài)共贏”的態(tài)度。截至目前,百度大腦開放平臺(tái)已對(duì)外開放158項(xiàng)AI技術(shù)和能力,更多能力也會(huì)逐步地開放出來,供開發(fā)者調(diào)用。開放生態(tài)之下,百度大腦平臺(tái)已匯集超100萬開發(fā)者,日調(diào)用量超過4000億,覆蓋20多個(gè)行業(yè)。在開放生態(tài)雨林中,百度與360行合作伙伴共同繪制智能生活藍(lán)圖,進(jìn)一步提升我國(guó)人工智能實(shí)力,讓復(fù)雜的世界變得更簡(jiǎn)單。
2019語言與智能技術(shù)競(jìng)賽報(bào)名日期截止于3月31日,將于4月1日至5月20日進(jìn)行比賽,5月底公布競(jìng)賽結(jié)果。百度誠(chéng)邀全球AI人才報(bào)名參加本次競(jìng)賽,與海內(nèi)外眾多開發(fā)者一較高下。具體報(bào)名方式及更多賽事信息登錄2019語言與智能技術(shù)競(jìng)賽官網(wǎng)了解。
| 分享此文章: |
“相關(guān)閱讀”
產(chǎn)品中心 Product Center
聯(lián)系電話:15303381562
聯(lián)系人:王經(jīng)理
QQ:249637288
地址:河北省衡水濱湖新區(qū)彭杜鄉(xiāng)西三景官二區(qū)38號(hào)
