属性数据分析(categorical data analysis),理学-数学-数理统计学-数据分析,对因变量是属性变量的数据进行分析的方法。这里的属性变量包括定性变量、定类变量和离散变量等取值离散的变量。其中,对离散变量研究较多的是二项分布、多项分布、泊松分布。属性数据分析主要分类:①一个因变量的情况。如果是估计该变量的参数,可以使用最大似然法估计进行假设检验、区间估计等。在大样本下,相应的统计量通常服从正态分布,在小样本下通常计算相应的精确分布。如果是非参数估计,则可以使用经验分布函数估计此变量的分布。②两个或多个因变量的情况。通常是列联表分析,可以通过卡方检验检验变量之间的独立性;可以用威尔科克森检验(Wilcoxon test)检验两维列联表中一个变量二分类情况下,两组是否存在显著差异;在三维情况下,可以进行边际分布的分析或者条件分布的分析。③部分广义线性回归模型。当因变量是二项分布时,常用逻辑回归模型;当因变量是泊松分布时,常用对数线性回归模型。这两个模型的估计方法采用迭代重加权最小二乘法求解模型的最大似然估计,采用拟合优度检验检验模型拟合的好坏。