布什词频定律(Booth's law of word frequency),理学-统计学-其他统计-文献计量,反映文献信息中低频词的分布规律。又称布什低频词词频定律。词源词频是指一个单词在文献或讲话中出现的次数。齐普夫定律(Zipf's Law)指出了词频分布的一次反比特点,即若将文献中出现的词汇按照其出现的频次做递减顺序排队,则其等级序号与相应频次之间的乘积大体上为一个常数。1938年,G.K.齐普夫就在齐普夫定律的基础上探讨了低频词的个数与其出现频次的数量关系,并称之为“齐普夫第二定律”。1967年,A.D.布什根据美国西保留地凯西大学(Western Reserve University)的文献交流中心以及埃德基(Eldridge)对4篇英文文献词频分布的统计结果,对文献中仅出现一次的单词数目与文献中出现的单词总数的比值进行计算,发现与“齐普夫第二定律”假设中所推导的理论值差异较大。于是布什采用齐普夫定律更一般的形式进行推导,对齐普夫的“第二定律”进行了修正,得到了布什词频定律,适用于描述低频词的分布规律,对高频词并无意义。