文本数据可视化(text data visualization),理学-计算机科学技术-计算机应用-可视化与混合现实-可视化与可视分析-信息可视化,将文本(特别是数据信息密度较低的文本)进行一定的处理,从中提取出最能代表文本所表达内容的信息,并将这些信息进行可视化的处理。文本是语言的书面表现形式,通常是具有完整含义的一个或多个句子的组合。文本数据在日常生活中广泛存在,例如新闻、微博、书籍等都是人们经常接触到的文本数据。随着信息技术的迅速发展,文本数据增长迅速,传统的文本阅读方式已经不能满足人们的需求。文本可视化可以帮助人们更高效地分析文本,辅助人们更好地决策。常用的文本可视化方法可以按照是词级还是主题级分为两类。词级的文本可视化方法首先从文本中提取关键词,再根据每个关键词的重要程度展示这些关键词,从而反映文本的侧重点。关键词的提取方法有很多,比较常见的是基于词频(term frequency,TF)的方法。此方法认为在文档中出现次数越多的词重要性越高。