当前位置: 首 页>>重要成果>>正文
彝语语料库的研究与建设
2014-12-25 沙马拉毅 王成平 孙国英 李文华 蔡波    (浏览次数:)

研究报告主要以国务院颁布的规范彝语为例,研究彝语语料库建设规范标准及示范语料库问题,从以下3个方面进行了阐述:1、彝语基础语料库建设规范研究; 2、彝语语料库标注规范研究; 3、依据规范进行彝语语料库的建设与开发研究。并取得了一系列的研究成果:收集、整理、录入600万的彝语文本资料,并完成了《彝语基础语料库建设规范》(初稿)的制定;完成彝语基础语料库建设规范、彝语语料库标注规范以及彝语语料的切分、标注以及相应辅助软件的设计与开发,完成了彝语标注框架工具、自动切分工具的设计;在全信息标注框架下,根据彝语言的特点建立了规范彝语语料库标注规范,并完成了《彝语语料库标注规范》(初稿)的制定;完成了《彝语基础例句语料数据库》《汉彝对照语料库》的建设与开发。这些成果将有利地推动彝语言的教学、研究以及语言工程等领域的研究。

   无论从彝语材料的整理、研究来看,还是从彝语的计算机处理来看,语料库都有着极为重要的价值,是深入开展这些工作的一个重要基础彝语语料库的研究与建不仅为彝语的教学、资料收集、科研研究等多方面提供丰富的语言基础资源,而且为彝语言在计算机信息处理、机器翻译、语音合成、语音识别、文字识别、智能检索、跨语言检索等的研究提供了确凿的语言数据,为建设各种彝文信息处理系统打下了坚实的基础,为促进用于知识发掘彝文语料库的建设奠定了一个坚实的基础,具有深远的现实意义。

 

关闭窗口
相关资讯
读取内容中,请等待...

版权所有 西南民族大学科技处(社科处)

四川省成都市一环路南四段16号(610041) 联系电话:028-85523956 电子邮箱:kjc@swun.cn