盲文语料库(Braille Corpus),理学-计算机科学技术-人工智能-自然语言处理-﹝语言知识资源﹞-语料库,一种存放了盲文字符语料的语料库。世界上没有独立于语言的盲文,也没有跨语言国际通用的盲文。从文字属性上看,有些语言的盲文有独立的文字地位,有些语言的盲文是纯粹的触觉符号,与记录该语言的视觉符号在文字本质上完全相同,英语盲文是典型的代表。英语盲文被公认为不是独立的文字,只是英语的一种特殊字体形式。英语一级盲文中,一方盲文符号对应一个字母,盲文符号与明眼文符号存在直接的、确定的对应关系,可直接互换显示。汉语盲文中,中国港澳台地区的盲文都采用按字分写、字字标调的方式,规则较为简单,盲文与明眼文(读音)的相互转写相对容易实现。具有上述特征的盲文可以直接使用明眼文语料库(触觉属性除外)转换得到盲文语料库,不需要构建专门的盲文语料库。中国通用的现行盲文采取了分词连写、标调大幅省略的方式,采用了不同于汉语明眼文的分词连写和标调原则。因此,汉语盲文研究不能直接使用汉语语料库,需要建设专门的盲文语料库。中国之外的国家还未有已公开发表的盲文语料库建设成果。