清華大學(xué)人工智能研究院自然語言處理與社會(huì)人文計(jì)算研究中心正式成立。這是清華AI研究院設(shè)立一周年之際成立的第八個(gè)研究中心,由孫茂松教授擔(dān)任主任。
2019 年 7 月 1 日,清華大學(xué)人工智能研究院自然語言處理與社會(huì)人文計(jì)算研究中心(以下簡(jiǎn)稱中心)成立儀式在清華大學(xué) FIT 樓舉行。清華大學(xué)副校長、清華大學(xué)人工智能研究院管委會(huì)主任尤政院士,清華大學(xué)人工智能研究院院長張鈸院士出席成立儀式并共同為中心揭牌。清華大學(xué)人工智能研究院院長助理朱軍教授主持成立儀式。
尤政院士致辭
尤政院士在致辭中指出,人類語言是人類智能的本質(zhì)體現(xiàn),更是人工智能技術(shù)當(dāng)下和未來發(fā)展的戰(zhàn)略制高點(diǎn)。清華大學(xué)是國內(nèi)最早開展自然語言處理的單位之一,經(jīng)過四十年的不懈努力,已經(jīng)發(fā)展成國內(nèi)外自然語言處理研究的一方重鎮(zhèn)。中心的成立對(duì)于推動(dòng)清華大學(xué)人工智能的深入發(fā)展具有十分重要的意義。自然語言處理與社會(huì)科學(xué)及人文科學(xué)相結(jié)合,具有大跨度學(xué)科交叉的性質(zhì),既是人工智能研究本身的積極拓展,也是對(duì)傳統(tǒng)學(xué)科在人工智能時(shí)代的守正出新。希望中心能夠凝聚清華自然語言處理研究力量,加強(qiáng)與人文社科學(xué)科的交叉合作,開展具有世界水平的自然語言處理基礎(chǔ)理論研究和關(guān)鍵技術(shù)創(chuàng)新,服務(wù)于清華與國家的人工智能發(fā)展戰(zhàn)略。
張鈸院士致辭
張鈸院士代表清華大學(xué)人工智能研究院致辭。他指出語言是人類智能的重要標(biāo)志,機(jī)器自然語言理解是人工智能的終極目標(biāo)。清華大學(xué)在自然語言處理方面有著深厚的研究積淀,1978 年成立人工智能與智能控制教研組時(shí),自然語言處理就是其中的重要研究方向之一,在黃昌寧教授領(lǐng)導(dǎo)下迅速發(fā)展成為國內(nèi)領(lǐng)軍的研究單位。新成立的中心將致力于實(shí)現(xiàn)自然語言處理與人文社科的深度融合,從語言、社會(huì)學(xué)、人文學(xué)等多個(gè)角度理解人類智能的本質(zhì),是研究院人工智能基礎(chǔ)研究的重要組成部分。希望中心再接再厲,在自然語言處理與社會(huì)學(xué)、人文學(xué)的交叉研究上形成特色,引領(lǐng)我國自然語言處理和社會(huì)人文計(jì)算研究領(lǐng)域的發(fā)展。
清華大學(xué)自然語言處理研究方向開拓者黃昌寧教授(左)在成立儀式上
朱軍教授主持儀式
尤政院士與張鈸院士為中心揭牌
中心主任由清華大學(xué)人工智能研究院常務(wù)副院長孫茂松教授擔(dān)任。在成立儀式上,尤政院士和張鈸院士向?qū)O茂松教授頒發(fā)了中心主任聘書。中國中文信息學(xué)會(huì)原理事長、中國工程院院士倪光南,滑鐵盧大學(xué)講座教授、加拿大皇家科學(xué)院院士李明,微軟亞洲研究院副院長、國際計(jì)算語言學(xué)會(huì)會(huì)長周明,英國帝國理工學(xué)院數(shù)據(jù)科學(xué)研究所所長、英國皇家工程院院士郭毅可被聘為中心學(xué)術(shù)顧問。尤政院士和張鈸院士現(xiàn)場(chǎng)向出席會(huì)議的李明院士和周明副院長頒發(fā)了中心學(xué)術(shù)顧問聘書。
孫茂松教授被聘為中心主任
李明院士、周明博士被聘為中心學(xué)術(shù)顧問
在成立儀式上,李明院士、周明副院長以及清華大學(xué)法學(xué)院院長申衛(wèi)星教授、清華大學(xué)人文學(xué)院副院長劉石教授先后發(fā)言,對(duì)中心的成立表示衷心祝賀。
申衛(wèi)星教授發(fā)言
劉石教授發(fā)言
中心成立儀式合影
嘉賓合影
成立儀式之后舉行了自然語言處理前沿學(xué)術(shù)報(bào)告與開源成果發(fā)布會(huì),分別由中心常務(wù)副主任劉洋副教授和中心主任孫茂松教授主持。
李明院士做特邀報(bào)告
李明院士做了題為《第二代對(duì)話機(jī)器人》的特邀報(bào)告。報(bào)告指出缺乏理解能力、缺乏學(xué)習(xí)能力、被動(dòng)地“人云亦云”是第一代聊天機(jī)器人的主要缺陷,其原因在于目前的深度學(xué)習(xí)技術(shù)還不具備理解和使用人類語言所必需的概念抽象和邏輯推理能力。他認(rèn)為實(shí)現(xiàn)理解和學(xué)習(xí)是第二代聊天機(jī)器人的主要目標(biāo),機(jī)器人只有通過自動(dòng)學(xué)習(xí)和社會(huì)參與才能獲得不斷地成長,從而具備更強(qiáng)的運(yùn)用人類語言的能力。
周明博士做特邀報(bào)告
周明博士做了題為《關(guān)于神經(jīng)網(wǎng)絡(luò)自然語言處理的思考》的特邀報(bào)告。報(bào)告對(duì)基于神經(jīng)網(wǎng)絡(luò)的自然語言處理的研究進(jìn)展進(jìn)行了系統(tǒng)地回顧與總結(jié),指出自然語言處理目前面臨著深度學(xué)習(xí)計(jì)算成本高昂、大規(guī)模標(biāo)注數(shù)據(jù)稀缺、難以實(shí)現(xiàn)真正的理解與推理等關(guān)鍵挑戰(zhàn)。他認(rèn)為未來應(yīng)當(dāng)從計(jì)算能力、數(shù)據(jù)資源、模型算法、系統(tǒng)應(yīng)用、人才培養(yǎng)、交叉合作等六個(gè)方面進(jìn)一步推動(dòng)自然語言處理的發(fā)展。
中心成員劉洋、矣曉沅和劉知遠(yuǎn)分別介紹了在數(shù)據(jù)驅(qū)動(dòng)的機(jī)器翻譯、基于深度學(xué)習(xí)的中文詩歌自動(dòng)生成系統(tǒng)以及大規(guī)模自然語言預(yù)訓(xùn)練模型等方面的最新研究成果,并發(fā)布了相關(guān)開源工具、數(shù)據(jù)與模型。
劉洋副教授介紹開源成果 THUMT
THUMT 是一個(gè)基于深度學(xué)習(xí)的機(jī)器翻譯系統(tǒng)。該系統(tǒng)使用了數(shù)據(jù)驅(qū)動(dòng)的機(jī)器翻譯技術(shù),具備良好的語言無關(guān)性,在具備訓(xùn)練數(shù)據(jù)的條件下可以迅速為新語種部署系統(tǒng)。本次開源成果公布了在TensorFlow 平臺(tái)上開發(fā)的新版本,采用了主流的 Transformer 模型,集成了目前最新的神經(jīng)機(jī)器翻譯技術(shù),具有訓(xùn)練速度快(支持多機(jī)多卡并行)、顯存占用低(支持單精度浮點(diǎn)數(shù)計(jì)算)、翻譯性能高(與國際機(jī)器翻譯開源軟件相比位居前列)、易于可視化分析(支持層級(jí)相關(guān)反饋算法)等優(yōu)點(diǎn)。此外還開放了 70萬句對(duì)的句級(jí)對(duì)齊漢英平行語料庫和 4 萬句對(duì)的詞級(jí)對(duì)齊漢英平行語料庫。項(xiàng)目網(wǎng)址:thumt.thunlp.org 在線翻譯系統(tǒng)網(wǎng)址:translate.thumt.cn
THUMT系統(tǒng)網(wǎng)址
THUMT翻譯界面
開源項(xiàng)目網(wǎng)址
矣曉沅博士生介紹開源成果 THUAIPoet
THUAIPoet (九歌)是一個(gè)基于深度學(xué)習(xí)的中文詩歌自動(dòng)生成系統(tǒng),支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。此次成果發(fā)布開源了系統(tǒng)中的無監(jiān)督風(fēng)格詩歌生成模型StylisticPoetry 源碼(相關(guān)論文發(fā)表于 EMNLP 2018),能夠在無標(biāo)注數(shù)據(jù)集上進(jìn)行任意數(shù)量的風(fēng)格解耦控制。此外還發(fā)布兩個(gè)人工標(biāo)注的詩歌數(shù)據(jù)集(詩歌質(zhì)量數(shù)據(jù)集和詩歌情緒數(shù)據(jù)集),以及國內(nèi)外詩歌生成相關(guān)的主要論文列表。GitHub 網(wǎng)址:github.com/thunlp-aipoet 九歌 APP 網(wǎng)址:jiuge.thunlp.cn
九歌APP網(wǎng)址
九歌詩詞創(chuàng)作系統(tǒng)界面
GitHub開源網(wǎng)址
劉知遠(yuǎn)副教授介紹開源成果 OpenCLaP
OpenCLaP(Open Chinese Language Pre-trained Model Zoo)是一個(gè)多領(lǐng)域中文預(yù)訓(xùn)練模型倉庫。通過在多領(lǐng)域大規(guī)模中文文本的預(yù)訓(xùn)練,這些預(yù)訓(xùn)練模型可以在下游任務(wù)上進(jìn)行微調(diào)以提高任務(wù)性能。本次開源成果公布了基于法律文本和百度百科千萬級(jí)文檔的預(yù)訓(xùn)練模型,支持最大 512 長度的文本輸入適配多種任務(wù)需求。未來還將持續(xù)加入更多更強(qiáng)的預(yù)訓(xùn)練模型,如增加更多訓(xùn)練語料,引入大規(guī)模知識(shí),使用全詞覆蓋策略等。GitHub 網(wǎng)址:github.com/thunlp/OpenCLaP 項(xiàng)目網(wǎng)址:zoo.thunlp.org
OpenCLaP網(wǎng)址
GitHub開源網(wǎng)址
中心是清華大學(xué)人工智能研究院設(shè)立一周年之際成立的第八個(gè)研究中心。中心將緊密圍繞人類語言所體現(xiàn)的人類智能本質(zhì),重點(diǎn)研究魯棒、可解釋的自然語言處理方法與技術(shù),深入探索語言理解與生成技術(shù)在社會(huì)人文計(jì)算領(lǐng)域的應(yīng)用,努力建設(shè)以中文為核心、覆蓋多種語言、從詞法到篇章的全流程自然語言處理技術(shù)框架與計(jì)算平臺(tái),力爭(zhēng)產(chǎn)出以智能創(chuàng)作、智能語言學(xué)習(xí)、智能教育、智能司法為代表的有國際影響力和重大民生意義的社會(huì)人文計(jì)算研究成果。
本中心的前身是清華大學(xué)計(jì)算機(jī)系自然語言處理課題組,早在上個(gè)世紀(jì)七十年代末就在黃昌寧教授的帶領(lǐng)下從事自然語言處理研究工作,是國內(nèi)開展相關(guān)研究最早、深具影響力的科研單位,同時(shí)也是中國中文信息學(xué)會(huì)(全國一級(jí)學(xué)會(huì))計(jì)算語言學(xué)專業(yè)委員會(huì)的掛靠單位,孫茂松教授現(xiàn)任該專業(yè)委員會(huì)的主任。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238251 -
清華大學(xué)
+關(guān)注
關(guān)注
2文章
69瀏覽量
17852 -
自然語言處理
+關(guān)注
關(guān)注
1文章
618瀏覽量
13552
原文標(biāo)題:清華成立自然語言處理與社會(huì)人文計(jì)算研究中心,孫茂松教授擔(dān)任主任
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論