话题检测与跟踪会议(Topic Detection and Tracking; TDT),理学-计算机科学技术-人工智能-自然语言处理-文本挖掘-文本挖掘评测,由美国国防高级研究计划委员会(DARPA)主办的一个关于信息抽取的会议。又名TDT。TDT致力于以事件的形式组织新闻信息的技术的研究和评测,其目标是将文本切割为不同的新闻报道,监控其中新事件的报道,并且将同一话题下的分散报道按照某种结构有效组织起来。TDT 的研究始于 1996 年,当时要求提出一种能监控新闻信息流的核心技术,这种技术可以有效的发现世界上发生的特定领域的新事件的报道。1997年,DARPA以及美国国家标准技术研究所(NIST)资助并主持了TDT系列评测会议。话题是TDT中的一个最基本的概念,在最初的研究阶段,话题与事件含义相同。一个话题是指由某种原因或者条件引起的,发生在特定时间和地点,并可能伴随某些必然结果的一个事件。后来,话题的概念要相对宽广一些,它包括一个核心事件或活动以及与之直接相关的事件或活动。TDT主要包括五个子任务:①对新闻报道的切分(Story segmentation)。