Web挖掘(Web mining),管理学-管理科学与工程-电子商务与商务智能-电子商务法-Web挖掘,发现和分析来自万维网的有用信息,即从与万维网相关的资源(如Web文件)与行为(如用户浏览行为)中抽取感兴趣的、有用的模式和隐含的信息。使用Web挖掘技术,可以提高搜索命中率并提供个性化的搜索服务。概述Web数据具有无标签、分散、差异化、半结构化、随时间变化、多维度等特征。因此,Web挖掘主要是针对具有上述特征的大型信息库的挖掘。在Web挖掘中,收集数据的途径有很多,如可以从服务器端、客户端、代理服务器或组织的数据库中收集。根据数据源的位置不同,所收集到的数据类型也不尽相同。同时,在内容(如文本、图像、音频、符号)和可能存在价值的信息等方面也存在着极大差异。这使得Web挖掘面对特定的任务需要特定的技术手段,没有任何一种技术可以解决Web挖掘中的所有问题。