您的位置:  首頁 > 民族語言文字 > 民族語文使用情況  > 詳細頁面

助力民族語文信息化跟上時代步伐 —— 記中國民族語文翻譯局信息處副處長何燕龍

來源:中國民族報 作者:樊焓希 發布時間:2019年10月30日 瀏覽量:

何燕龍(右三)和同事探討工作。 受訪者供圖

  

  何燕龍,中國民族語文翻譯局信息處副處長、高級工程師,民族語文軟件研發基地負責人。入選國家民委領軍人才支持計劃、創新團隊支持計劃,獲保密科學技術獎二等獎、錢偉長中文信息處理科學技術二等獎。

  近年來,我國在國際自然語言處理領域的表現較為活躍,科研成果數量也在逼近美國,但就少數民族語文的信息化而言,還處在較低水平。

  “我從事了26年的計算機應用與民族語文軟件研發工作?!焙窝帻堈f,“民族語文翻譯軟件助力民族工作、服務國家大局的目標,始終引領著我工作的方向,并給予了我堅守這份事業的動力和信心?!?/p>

  搭建民族語文翻譯的橋梁

  1987年,何燕龍以優異的成績考入北京信息工程學院計算機系(現北京信息科技大學)。1991年畢業后,他被分配到航天部第一研究院101所,從事運載火箭自動控制工作。1993年7月,何燕龍調入中國民族語文翻譯局,從事計算機應用與民族語文軟件研發工作。

  調入中國民族語文翻譯局工作后,何燕龍每年都會參加全國兩會民族語文翻譯組的工作?!耙驗橐y一集中封閉辦公,那會兒我的同事們每次都要背著大本小本的辭書,擺在樓道里,以便查閱?!焙窝帻堈f,當時他就想,如果能研發出一款軟件,可以讓大家不背這些書,只帶著軟件上會,那該多方便。

  如今,20多年過去了,何燕龍實現了這個愿望?!拔业耐聜冊缇筒槐匙值?、辭典上會了。我們最新研發的翻譯軟件,在黨的十九大和近年來的全國兩會民族語文翻譯工作中都發揮了重要作用?!焙窝帻堈f。

  上世紀90年代末,民族語文信息化工作進入詞處理階段。該階段的主要工作是構建語料庫,搭建和訓練自動加工處理模型。

  2000年前后,何燕龍出版了著作《北大方正書版實用手冊》和《北大方正飛騰實用手冊》。2007年左右,他開始研究民族語文輸入法和校對軟件,隨后帶領翻譯局信息化團隊,先后完成了多種民族語文翻譯輔助軟件的研發,其中包括蒙古、藏、維吾爾、哈薩克、朝鮮、彝、壯7種民族文電子詞典及輔助翻譯軟件、校對軟件,蒙古文正音正形、哈薩克文與斯拉夫文、朝鮮文與韓文等6款編碼轉換軟件,漢文與7種民族語文對照查詢系統,以及Windows7軟件等,為今后的機器翻譯打下了基礎。

  2010年左右,民族語文信息化工作進入智能化產品及應用階段,特別是深度神經網絡技術的成熟與應用。這個階段,民族語文翻譯局建立了國內首個民族文多語種智能翻譯及語音系統平臺,被國家民委列為“民族語文軟件研發基地”。

  作為信息化平臺的工程師和研發基地的負責人,2013年以來,何燕龍主持研發了民漢對話通、語音轉寫通、民漢智能語音翻譯軟件、民漢實時翻譯軟件、民族文照相翻譯軟件、民族文手機輸入法軟件、民族文電子詞典和校對軟件等50多款民族文應用軟件。

  2012年、2018年,團隊研發成果“彝文、壯文電子詞典及輔助翻譯軟件”和“維漢智能翻譯系統及其應用”分別榮獲該年度錢偉長中文信息處理科學技術二等獎;2018年,“專用計算機民族語言應用”項目榮獲國家保密局科學技術獎二等獎,“藏漢智能語音翻譯系統”和“藏漢語音轉寫通”榮獲中國網絡社會組織聯合會應用工具類優秀作品獎。

  同時,在僅3年多的時間里,何燕龍還帶領專業數據整理團隊,積累了5000多萬句多語種平行語料和上萬小時的語音數據。在研發過程中,他們克服重重困難,開拓探索出了翻譯局自有的語料收集方式。

  2019年,7個語種語音識別軟件升級后,蒙古文語音數據從1200小時上升到3000小時,安多藏文從1500小時上升為2400小時,康巴藏文從1200小時上升到2000個小時,維吾爾文從2500個小時上升到4000個小時。此外,新收錄哈薩克文1000個小時,朝鮮文600個小時,彝文840個小時,壯文400個小時。

  這些數據實現了民族語文信息化工作的飛躍,“翻譯局信息化工作能有今天的成績,要感恩中央對民族語文信息化工作的高度重視,也離不開各語文室同事們的大力支持和協助?!焙窝帻堈f。

  做好民族語文信息化工作是愛好

  何燕龍認為,完美的研發沒有捷徑,他關注所有的細節?!懊褡逭Z文信息化軟件的研發過程要求非常嚴格,不允許有任何的偏差,甚至小的瑕疵?!焙窝帻堈f。新入職的小伙子們,經常會因為網線接口不牢固而被批評。在年輕人看來,有些松動的接口一樣可以使用,并不影響效果,但何燕龍卻要求盡善盡美。

  身邊的少數民族同事曾這樣問何燕龍:“您是漢族,不會我們的母語,但您做起民族語文信息化研究,一點不遜色于我們本民族的專家學者,您是怎么做到的?”

  “能夠做好民族語文信息化工作,不在于我是不是少數民族,這是我的愛好。做愛好的事,很幸福!”何燕龍這樣回答。

  當今世界,大數據、人工智能等現代信息技術不斷取得突破,數字經濟蓬勃發展。近年來,中國民族語文翻譯局積極適應民族工作和信息化時代新形勢,加大了民族語文翻譯應用研究和基礎工程建設,在民族語文信息化建設方面取得了突破性成果,并已應用于國家安全、司法審判、新聞廣播、扶貧駐村、雙語學習與國家通用語言推廣等領域,為國家需要和民族地區實際需求提供了及時有力的支持。

  “民族語文信息化建設前景廣闊,我為自己能夠從事這項事業感到榮幸?!焙窝帻堈f,“同時我們也要清醒地認識到,民族語文信息化要跟上時代步伐,從跟跑實現并跑,再到領跑,還有很長的路要走,這需要我們加倍努力和更勤奮地付出?!?/p>

  

  作者:樊焓希

  資料來源:中國民族報

  http://www.mzb.com.cn/zgmzb/html/2019-08/20/content_11332.htm

上一篇:
下一篇: