日前,國(guó)際自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)領(lǐng)域最高級(jí)別的學(xué)術(shù)會(huì)議ACL(Annual Meeting of the Association for Computational linguistics)錄取了京東智能廣告實(shí)驗(yàn)室(JD Intelligent Advertising Lab簡(jiǎn)稱JD IAL)和 Rensselaer Polytechnic Institute?(倫斯勒理工學(xué)院)聯(lián)合發(fā)表的題為“基于多語(yǔ)言多任務(wù)的低資源序列標(biāo)注架構(gòu)”的學(xué)術(shù)論文。論文首次提出了一種多語(yǔ)言多任務(wù)的監(jiān)督學(xué)習(xí)架構(gòu),該架構(gòu)對(duì)中文自然語(yǔ)言處理以及低資源語(yǔ)言的學(xué)習(xí)效果提升具有積極意義。
眾所周知,由于語(yǔ)言的多樣性和復(fù)雜性,自然語(yǔ)言處理(NLP)在學(xué)術(shù)和工業(yè)應(yīng)用上一直是非常具有挑戰(zhàn)的領(lǐng)域。同時(shí)由于中文語(yǔ)言的獨(dú)特性和高靈活特點(diǎn),基于中文的自然語(yǔ)言處理任務(wù)會(huì)更加復(fù)雜。
京東在服務(wù)數(shù)以億計(jì)的用戶同時(shí),積累了大量的文本信息,如商品的名稱,屬性,用戶評(píng)論和問(wèn)答等。有效利用好這些文本信息,就能大幅提升京東的服務(wù)質(zhì)量和用戶滿意度。然而,由于文本形式口語(yǔ)化,文本內(nèi)容豐富,用以訓(xùn)練模型的標(biāo)注數(shù)據(jù)少等問(wèn)題,工程師在實(shí)際NLP技術(shù)開發(fā)中遇到了很大的挑戰(zhàn)。
針對(duì)以上挑戰(zhàn),京東智能廣告實(shí)驗(yàn)室提出了一種多語(yǔ)言多任務(wù)的監(jiān)督學(xué)習(xí)架構(gòu)。該架構(gòu)結(jié)合了多種遷移學(xué)習(xí)模型,通過(guò)利用多任務(wù)訓(xùn)練的方式,極大地提升了低資源語(yǔ)言的學(xué)習(xí)效果。例如,在標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)上,相比于傳統(tǒng)的單語(yǔ)言、單任務(wù)的學(xué)習(xí)方法,利用新方法在實(shí)體標(biāo)注任務(wù)上取得了 4.5% 到 50% 的性能提升(F值)。
據(jù)京東集團(tuán)副總裁、商業(yè)提升事業(yè)部總裁,同時(shí)也是京東智能廣告實(shí)驗(yàn)室負(fù)責(zé)人顏偉鵬博士介紹,針對(duì)復(fù)雜和較少標(biāo)注的中文數(shù)據(jù),通過(guò)引入大量的英文標(biāo)注數(shù)據(jù),能夠有效提升中文序列標(biāo)注(Sequence Labeling)的效果。目前該技術(shù)已經(jīng)應(yīng)用到京東的商品推薦,排序和文本生成等實(shí)際應(yīng)用中。
京東智能廣告實(shí)驗(yàn)室隸屬京東商城商業(yè)提升事業(yè)部,主要從事智能廣告相關(guān)的基礎(chǔ)研究和應(yīng)用研究,研究范疇涵蓋視頻圖像、NLP、大規(guī)模機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、推薦技術(shù)、廣告機(jī)制等多個(gè)領(lǐng)域。實(shí)驗(yàn)室成員包括有學(xué)術(shù)能力的碩士、博士研究生以及經(jīng)由實(shí)驗(yàn)室招募的優(yōu)秀學(xué)者、在行業(yè)內(nèi)和學(xué)術(shù)圈內(nèi)有技術(shù)影響力的科學(xué)家。目前京東智能廣告實(shí)驗(yàn)室已累計(jì)研究成果數(shù)十項(xiàng),其中多個(gè)項(xiàng)目榮獲京東集團(tuán)技術(shù)創(chuàng)新獎(jiǎng)項(xiàng),多篇論文被國(guó)內(nèi)外知名學(xué)術(shù)機(jī)構(gòu)收錄。
-
京東智能
+關(guān)注
關(guān)注
0文章
8瀏覽量
5596 -
nlp
+關(guān)注
關(guān)注
1文章
487瀏覽量
22030
原文標(biāo)題:中文自然語(yǔ)言處理實(shí)現(xiàn)突破,京東智能廣告實(shí)驗(yàn)室論文被ACL收錄
文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論