新华丝路首页
一带一路国家级信息服务平台

我国将打造1.2亿词级蒙古文文献语料库

来源:新华社 责任编辑:顾雯丽 2018-11-23 14:45:03

新华社呼和浩特11月23日电 (记者勿日汗) 我国正在建设一个总字数将达到1.2亿词的大型蒙古文文献语料库,目前已完成800万字语料的录入校对工作。

记者从承担这项工作的内蒙古自治区社会科学院了解到,蒙古文文献语料库,将穷尽式收集和纳入自蒙古文第一部文献《成吉思汗碑文》(1225年)以来的中世纪传统蒙古文文献和近代蒙古文木刻本文献。对于现代文献,将按学科分类,即按法律法规、文学艺术、新闻媒体、医药医学、应用公文、教学教材、军事、体育等择优选录。

蒙古文文献语料库建设将通过录入、校对、数据标注加工等环节,按照国际领先水准,设计蒙古文语料资源管理平台网络版。其最终目标是建成世界最大、最全、最精的网络版蒙古文文献语料库,为保护、开发、利用蒙古文文献资料提供基础。

2015年策划开展的这项工作将于2024年结束。目前,正在进行共109卷的佛教经典蒙古文《甘珠尔经》的录入工作。

相关推荐
山东省在日本名古屋成功举办智能制造交流会

山东省-日本智能制造交流恳谈会日前在日本名古屋成功举办。来自中日汽车、装备、物流等领域的60多家企业及机构的110多名代表参会,围绕贸易投资和项目合作进行了充分交流。

坦桑尼亚桑给巴尔总统向中国援桑医疗队授勋

坦桑尼亚桑给巴尔总统姆维尼8月25日在桑给巴尔总统府接见第34期中国(江苏)援桑给巴尔医疗队,向全体队员授勋、颁发奖章及纪念证书,以表彰他们对桑医疗卫生事业作出的贡献。

坦桑尼亚总统哈桑称赞中坦合作成果显著

坦桑尼亚总统萨米娅·苏卢胡·哈桑1日在达累斯萨拉姆出席东非商贸物流中心开业仪式。