登錄

首頁 > 文明之橋 > 學術交流

“綜合型語言知識庫”獲教育部科技進步獎一等獎

發布時間:2017-09-08 浏覽數:2204

綜合型語言知識庫”獲教育部科技進步獎一等獎

北京大學計算語言學研究所


    “綜合型語言知識庫”獲2007年度教育部科技進步獎一等獎。該項成果是北京大學計算語言學研究所取得的,獲獎人員有:俞士汶、段慧明、孫斌、常寶寶、劉揚、朱學鋒、張化瑞、陸儉明、于江生。

      1995年底朱學鋒、俞士汶在一次學術會議上作了題為《自然語言處理與語言知識庫》的報告(見羅振聲、袁毓林主編《計算機時代的漢語和漢字研究》,清華大學出版社,1996年第一版,107-118),提出建立“綜合型語言知識庫”的規劃,北大計算語言所師生随之付諸實踐、日積月累,截至2006年底,取得了階段性成果。綜合型語言知識庫的研制持續了十餘年,實在是“十年磨一劍”。若從開始研制綜合型語言知識庫的第一塊基石——《現代漢語語法信息詞典》算起,北大計算語言所在建設語言知識庫的征途上已走過了20多個年頭(《現代漢語語法信息詞典》1995年5萬詞版,曾獲1998年度教育部科技進步獎二等獎)。

      2007年度申報獎勵的“綜合型語言知識庫”包括以下成果:(1)現代漢語語法信息詞典(8萬詞版),(2)漢語短語結構知識庫,(3)中英文概念詞典,(4)現代漢語大規模基本标注語料庫,(5)漢英雙語對齊語料庫,(6)基于語料庫的雙語詞典編纂系統,(7)信息提取系統(含漢語文本詞語切分與詞性标注軟件)。它在漢語計算語言學理論、漢語語言知識形式化描述、語言知識庫構建技術以及多語言知識融合技術等方面都有所創新。

      申報獎勵之前,“綜合型語言知識庫”通過了教育部組織的以張钹院士為主任、懷進鵬教授為副主任的鑒定委員會的技術鑒定:“其規模、深度、質量和應用效果在我國語言工程實踐中是前所未有的。該成果是以漢語為核心的多語言知識庫建設中最全面、最重要的研究成果,總體上達到了國際領先水平。”該項成果為推動以漢語為核心的多語言信息處理技術的發展做出了重要的貢獻,并取得了顯著的經濟效益。作為單項技術成果,在北京大學創下了轉讓次數最多的紀錄。

    “綜合型語言知識庫”的研制是在多個國家級研究項目的支持下進行的,包括973、863、國家科技攻關項目、國家自然科學基金、國家社科基金等,也得到很多大學、研究所和企業的支持以及學界先進的指導。獲獎人員向所有給予過支持和幫助的部門、單位、師友緻以衷心的感謝,同時也向默默奉獻而未能列入獲獎名單的課題組其他成員表示深深的敬意。

    “綜合型語言知識庫”仍在繼續發展。俞士汶承擔的國家重點基礎研究課題(973)“文本内容理解的數據基礎”的後三年(2007-2009)調整計劃已将“綜合型語言知識庫系統”的開發列為研究工作的重點。“綜合型語言知識庫系統”不僅把現在的語言知識資源集成為一個有機的整體,各個成員知識庫可以相互參照,互相印證,而且進一步挖掘深層的語言知識,發展概率型漢語詞彙知識庫,讓語言知識庫建設更上一層樓,同時,将有新成員不斷加入“綜合型語言知識庫”的大家庭。  



電話:0731-82705649 郵箱:348938@qq.com 郵編:410016

地址:湖南省長沙市芙蓉區楊家山職院街199号

版權所有 © 湖南省語言文字培訓測試中心 ©備案/許可證編号為:湘ICP備13010807号