搜索结果: 1-5 共查到“中国少数民族语言文字 语料库”相关记录5条 . 查询时间(0.153 秒)
中国建成4000万词级蒙古语自然口语语料库
蒙古语 自然口语 语料库
2013/2/21
历经7年的搜集录制和标注加工,中国已在内蒙古自治区呼和浩特市建成一个4000万词级的蒙古语自然口语语料库。据内蒙古社会科学院蒙古语言文字研究所所长达·巴特尔介绍,这一时长达3826小时的蒙古语自然口语语料库由档案文件、检索界面和资源系统组成。资源库可检索、可视听、可复制。据悉,内蒙古自治区从2006年起投巨资实施该工程。这项工程是以搜集自然口语语料、收集书面语朗读语料、汇集现代文献语料和历史文献语...
基于藏语语料库的词类分类体系研究
词类分类体系 藏语语料库
2008/11/18
对于英语、法语和德语等西方语言而言,词与词之间一般采用自然的空格作为切分标记,但在汉语、藏语和日语等语言的实际切分中没有自然的空格作为标记,这就需要通过人工或机器对其进行词与词的切分和标注。
鄂伦春等民族语言将被存入语料库
2007/9/26
本报讯 为了抢救祖国文化遗产和民族语言信息资源,并永久保存鄂伦春语口语资料,内蒙古自治区将《蒙古语语料库》的建设列为“建设民族文化大区”重点项目的同时,也将鄂伦春语、达斡尔语、鄂温克语等三个民族语言语料的搜集列入其中。
鄂伦春族总人口数不到一万人,大都分布在东北的大、小兴安岭一带。随着时代的不断进步,鄂伦春民族的生活水平不断提高,但鄂伦春民族的语言却濒临失传。这次将鄂伦春等三个民族的语言列入...
创建基于大规模真实文本的动态蒙古语语料库
文本 蒙古语 动态 语料库
2007/3/22
该文介绍了蒙古文语料库的发展历程和特点,并针对蒙古语自然处理发展技术及自身特点提出了创建蒙古语动态流通语料库的思路,为创建大规模真实文本的蒙古语语料库提供了可能。同时还介绍了流通度的概念及蒙古语新词语的提取方法和研究路线。
台湾大学台湾南岛语多媒体语料库
台湾大学台湾南岛语多媒体语料库 南岛语 语言
2008/1/3
台湾大学台湾南岛语多媒体语料库,原为国立台湾大学信息电子科技整合研究中心「多媒体整合实验室」计划的子计划之一,结合了台湾大学数个学院(电机信息学院、文学院、社会科学院、管理学院)之部分系所(含语言所、信息系、图资系、资管系、电机系、新闻所、戏剧系)的专业人才,希望以语言为主轴,藉由信息科技运用,建置语言数据典藏及后设数据之标准。该语料库的主要目的除了保存珍贵的语料,更要将这些语言做系统性的汇整,以...