答案类型预测(answer type prediction; ATP),理学-计算机科学技术-人工智能-自然语言处理-问答系统-自动问答技术,判断问题答案类型的计算机语言处理方法。答案类型预测是问题分析的关键步骤,其目标是判断问题的答案类型。答案的类型可以有多种划分方法。根据形式的不同,答案可以分为词、句子、段落等类型;根据语义的不同,答案可以分为实体名、数值、字符串等,其中实体名还可以细分为人名、地名、机构名等。答案类型预测主要有两类方法:基于规则的方法和基于统计模型的方法。基于规则的方法一般需要对问句进行词法分析、句法分析、实体标注等操作,然后基于以上信息人工设计一组规则判断给定问句的答案类型。例如,可以设计如下规则“rule1:以‘谁’开头的问句的答案类型为人名”,那么对于问句“谁是中国的第一位皇帝?”,通过上述规则可以判断其答案类型为人名。基于统计模型的方法则通过分类模型(例如逻辑斯蒂回归模型)对问句的答案类型进行分类。