Web内容挖掘(Web content mining),管理学-管理科学与工程-电子商务与商务智能-电子商务法-Web内容挖掘,一种主要利用文本分类、文本聚类、文本可视化、自动摘要等技术,从大量的Web内容中发现信息、提取有用信息的Web数据挖掘方法。万维网时代,信息的传播速度加快,信息的价值不断增长。Web数据挖掘的出现,带来了信息的革命。Web数据挖掘从数据挖掘的定义扩展而来,又不同于传统的数据挖掘,其对象、方法更为广泛。根据挖掘对象,Web数据挖掘可分为内容挖掘、使用挖掘以及结构挖掘。Web内容挖掘的数据对象众多,包括结构化数据、半结构化数据、非结构化数据。从不同的角度出发,Web内容挖掘具有不同的目标。从资源搜索的角度(又名用户的角度)来看,Web内容挖掘的目标在于提高信息质量,并帮助用户过滤信息,提取最重要的信息;从数据库的角度来看,其任务则是对数据进行集成、建模和存储,以支持数据的复杂查询。根据分类方法的不同,Web内容挖掘可划分为多种类型。Web内容挖掘的实现方法包括信息检索方法和数据库方法。