首页 > 文章中心 > 正文

网络信息资源数据挖掘类型和应用

前言:本站为你精心整理了网络信息资源数据挖掘类型和应用范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。

网络信息资源数据挖掘类型和应用

随着Internet的飞速发展,网络信息资源急剧增长,网络信息过载问题日益突出,人们越来越多地关注如何开发和利用这些资源。然而,目前中英文搜索引擎均存在查准率、查全率不高的现象,这种现状无法适应用户对高质量的网络信息服务的需求;同时,电子商务以及各种网络信息服务迅速兴起,原有的网络信息处理与组织技术无法赶上这样的发展趋势。网络信息挖掘就是在这样的环境下应运而生,并迅速成为网络信息检索、信息服务领域的热点之一。

网络信息的数据挖掘不仅包括对网页内容本身的挖掘,也包括其链接模式,以及用户访问、存取、浏览、、操作等操作行为、访问行为所产生的信息的挖掘。有效地研究、挖掘、利用网络信息可以增强网站的吸引力,有的放矢地吸引用户群,更有效地利用网络资源。

一、网络信息资源及其特点

网络信息资源是指放置在英特网上能满足人们信息需求的信息集合。网络信息资源极其丰富,包罗万象,其内容涉及农业、生物、化学、数学、天文学、航天、气象、地理、计算机、医疗和保险、历史、法律、音乐和电影等几乎所有专业领域,是知识、信息的巨大集合,是人类的资源宝库。网络信息资源是一种新型数字化资源,与传统文献相比有较大的差别。网络信息资源具有一下特点:

1、数量大,类型多传播范围广。网络信息类型多样,有文本、数据、图像、图形、声频、视频信息、多媒体信息等;内容既有高质量的信息,也有有害信息和虚假信息,有个人信息也有在政府信息。最为特殊的是各种非正式信息被广泛生产与传播。

2、网络信息资源没有统一的管理机制,信息安全缺乏保障。黑客攻击、计算机病毒和色情泛滥成为网络的三大痼疾。为防止有害信息耗费了大量的社会资源。

3、网络信息资源分布零乱无序,信息更新快,寿命短,管理相对困难。信息自由,来源广泛,内容混杂,质量不一,控制也比较困难。

4、以网站为信息活动的单位,以网页为信息和收集的单元。

5、信息利用水平取决于网站软硬件的技术水平和服务能力,网络信息提供方式是以网站为基点并可在网站间灵活链接的信息服务网。

6、网络创造了多层次的信息交流模式,全面反应了社会生活的各个领域,形成了百科全书式的知识网络和传播功能。

二、数据挖掘的语言

数据挖掘语言有助于数据挖掘系统平台的标准化,推动数据挖掘应用的发展。数据挖掘语言根据功能和侧重点的不同,可分为三种类型:数据挖掘查询语言、数据挖掘建模语言、通用数据挖掘语言。

(一)数据挖掘查询语言DMQL

数据挖掘查询语言DMQL由数据挖掘原语组成。数据挖掘原语用来定义一个数据挖掘任务,通过查询的方式实现与数据挖掘系统通信,获得所需信息。数据挖掘查询语言DMQL主要有五种基本的数据挖掘原语定义:任务相关数据原语、被挖掘的知识的种类原语、背景知识原语、兴趣度测量原语、被发现模式的表示和可视化原语。DMQL是基于这五种数据挖掘原语设计的查询式语言,类似于SQL语言的语法,因此很容易与SQL关系查询语言集成,很容易从关系数据库中挖掘知识信息。MSQL是另一个数据挖掘查询语言,由Imielinski和Virmani提出。它使用了类似于SQL的语法和SQL原语,为了规范规则产生和规则选择,提出了被称作GetRule和SelctRule的原语。

(二)数据挖掘建模语言PMML

数据挖掘建模语言PMML全称预言模型标记语言(PredictiveModelMarkupLanguage),是对数据挖掘模型进行描述和定义的语言,使数据挖掘系统在模型定义和描述方面有法可依,各种数据挖掘系统可以共享模型,又可以在应用程序系统中间嵌套数据挖掘模型,不需要独自开发,就能使数据挖掘达到深度挖掘的目的。预言模型标记语言PMML是一种基于XML的数据挖掘建模语言,利用XML描述和存储数据挖掘模型,使用标准的XML解析器对PMML解析,可以得到预计的输入和输出数据类型。PMML2.0主要由:标题(header)、数据字典(datadictionary)、数据流(dataflow)、挖掘模型(miningschema)、数据转换(DerivedValues、Statistics、Taxonomy、Normalization)、预言模型(TreeModel、NaiveBayes、GeneralRegression、RegressionModel、Sequences、GeneralStructure、AsscocationRules、NeuralNetwork、CenterandDistributionbasedClustering)、模型组合定义(ensemblesofmodels)、选择和联合模型和模型组合的规则(rulesforselectingandcombiningmodelsandensemblesofmodels)、异常处理的规则(rulesforexceptionhandling)等九个部分组成。对于复杂的数据挖掘任务,由多个数据源和数据挖掘模块,需要在各个模块之间交换结果,预言模型标记语言PMML的主要组成部分拥有这种灵活的模型交换能力和数据格式转换能力,并实现模型与数据和工具部分分离。因PMML是基于XML的数据挖掘建模语言,适合部分学习、元学习、分布式学习的数据挖掘应用程序。

(三)通用数据挖掘语言OLEDBforDM

通用数据挖掘语言OLEDBforDM是2000年3月微软公司推出的一个数据挖掘语言,目的是为数据挖掘行业提供一个业界标准。OLEDBforDM综合了数据挖掘查询语言DMQL和数据挖掘建模语言PMML的特点,既能定义模型,又能作为查询语言与数据挖掘系统通信,进行交互的和特殊的数据挖掘,实现了数据与模型真正分离。OLEDBforDM是一种基于SQL预言的协议,扩充了SQL语言语法,可以轻松地与关系型数据库集成,可以将不同的数据挖掘算法嵌入数据挖掘应用程序。OLEDBforDM为了更接近关系型数据库结构,定义了几个重要的概念。

数据挖掘模型(DataMiningModel,DMM):DMM像数据库中的关系表,但是它包含了一些特殊的列,这些列被数据挖掘中的数据训练和预言制定使用。DMM既可以用来创建预言模型,又可以产生预言。标准的关系表用来存储原始数据而DMM存储被数据挖掘算法发现的模式,对于从事WEB挖掘的开发人员,DMM所有的结构和内容都可以用XML字符串表示。

预言联接操作(PredicationJoinOperation):预言联接操作类似于SQL语言中的连接操作,在一个训练好的数据挖掘模型和输入数据源之间映射一个连接查询,将能得到符合需求的预言结果。这个预言结果通过OLEDB的行集合或者ADO记录集(recordset)发送到消费者应用程序内。OLEDBforDM模式行集合(SchemaRowsets):OLEDBforDM模式行集合用于特殊目的模式行集合允许消费者应用发现临界的信息,例如:可利用的挖掘服务、挖掘模型、挖掘列和模型内容等。

三、网络信息挖掘的类型

根据挖掘的对象不同,网络信息挖掘一般可分为三类:网络内容挖掘(Webcontentmining)、网络结构挖掘(Webconstructmining)和网络用法挖掘(Webusagemining)。

(一)网络内容挖掘

网络内容挖掘是指从网络的内容/、掘内容挖掘语言。的关系表用来存储原始数据,据挖掘任务,数据/文档中发现有用信息的过程。网络信息资源类型众多,目前WWW信息资源已经成为网络信息资源的主体,Internet出现之前的Gopher、FTP、Usenet资源逐渐隐藏到WWW形式之后,但这些资源仍可以通过Web进行访问。然而除了大量的人们可以直接从网上抓取、建立索引、实现检索服务的资源之外,一些网络信息是“隐藏”着的数据,如由用户的提问而动态生成的结果,或是存放在DBMS(数据库管理系统)中的数据,或是那些私人数据,它们无法被索引,从而无法提供对它们有效的检索方式。以上是从网络信息源的角度探讨,若从资源形式看,网络信息内容是由文本、图像、音频、视频、元数据等等形式的数据组成的,因而我们所说的网络内容挖掘将是一种多媒体数据挖掘形式。

(二)网络结构挖掘

网络结构挖掘是从WWW的组织结构、Web文档结构及其链接关系中推导知识。主要是针对Web潜在的链接结构,通过网页链接找到隐藏在页面之后的链接结构模型。网络结构挖掘的目的是发现Web和页面的结构及其蕴含在这些结构中的有用模式,对页面及其链接进行分类和聚类,由此获得有关不同网页间相似度及关联度的信息,有助于用户找到相关主题的权威站点,并且可以通过浏览权威网站企业可以了解本行业的最新动态信息,了解一些著名的大型企业的发展动态。还可以发现Web文档自身的结构,这种结构用于用户的浏览,也利于对网页进行比较和系统化。

(三)网络用法挖掘

通过网络用法挖掘,可以了解用户的网络行为数据所具有的意义。网络内容挖掘、网络结构挖掘的对象是网上的原始数据,而网络用法挖掘则不同于前两者,它面对的是在用户和网络交互的过程中抽取出来的第二手数据。这些数据包括:网络服务器访问记录、服务器日志记录、浏览器日志记录、用户简介、注册信息、用户对话或交易信息、用户提问式等。

四、网络信息的数据挖掘的应用

随着Internet的迅速发展和不断的普及应用,网络信息资源越来越丰富,如何分析和利用这些海量的数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和广阔的应用前景。

通过网络信息挖掘,可以收集政治、经济、政策、科技、竞争对手、供求、客户等有关的信息,分析和处理这些信息,并根据分析结果找出经营管理过程中出现的各种问题,有利于改善管理的效率和效果。网络信息挖掘可以应用在许多方面,例如:

1、科学研究。随着先进的科学数据收集工具的使用,如观测卫星、遥感器、生物信息技术等,所涉及的数据量非常大,传统的数据分析工具无能为力,网络数据挖掘作为一种强大的智能型自动数据分析工具得以广泛应用。

2、市场营销。利用网络数据挖掘技术通过对用户数据进行分析,可以得到关于顾客购买取向和兴趣的信息,从而为商业决策提供可靠的依据。

3、金融投资。由于金融投资的风险很大,在进行投资决策是,更需要对各种投资方向的数据进行分析。数据挖掘可以通过对已有数据的处理,找到数据对象之间的关系,然后利用学习得到的模式进行合理的预测。

4、产品制造。数据挖掘对产品数据的分析,有助于对改进产品质量提出有针对性的建议,或提出信息的更高效的控制模式,从而为制造厂家带来更多的回报。

5、教学管理。如远程教育中的网络资源发现,分析教学网站的结构组织是否符合学生学习和教师教学的规律、教学评价等。教学评价的技术水平是衡量一个国家教育发展水平的重要尺度。传统的定性与定量教学评价存在许多问题。将数据与挖掘这种新的数据分析技术应用于教学评价之中,可以提高教些评价技术水平,使之更好地为教学服务。

6、Internet或其他通信网络管理等的应用。

下面主要介绍网络信息挖掘在电子商务、网络广告和竞争情报中的应用。

(一)网络信息挖掘在电子商务中的应用

1、网络信息挖掘在电子商务中应用的必要性

电子商务是指个人或企业通过国际互联网络,采用数字化方式进行商务数据交换和开展商务业务活动。电子商务过程中产生了大量的数据,数据挖掘是对这些数据进行分析的有效方法。由于Web的易用性、实用性,它很快占据了网络信息主导地位,目前已经成为使用最为广泛、最有前途的信息传播技术。电子商务中产生的数据有其自身的特点,把数据挖掘技术与电子商务进行有机结合,选用适合电子商务数据的挖掘方法,可以提供数据挖掘的效率,让数据挖掘更好地为电子商务服务。电子商务是以网络技术和Web数据库技术为支持的,其中,Web数据库技术是电子商务的核心技术,Web数据库的发展成为新的热点和难题。Web数据库能将数据库技术与Web技术很好地融合在一起,是数据库系统成为Web的重要有机组成部分,能够实现数据库与网络技术的无缝有机结合。客户是数据挖掘研究的对象之一,它能发现客户的共性和个性、必然和偶然、独立和关联、现实和预测等知识。通过这些知识可以对客户的消费行为如客户消费的心理、能力、动机、需求等作出比较客观的统计和准确的分析,为电子商务的管理者提供决策依据。电子商务组织管理者必须通过访问网络最新和最准确的信息,对产品、客户、合作伙伴和进程做出明智的决策,从而赢得竞争优势。

近年来,电子商务站在企业商贸领域占据着越来越多的市场份额,网络信息挖掘主要用于商品的市场定位和消费分析,以辅助制定市场策略,还可以用来分析购物模式,预测销售行情等。

2、网络信息挖掘在电子商务中的主要应用

(1)针对不同客户提供个性化的产品

销售商可以获知访问者的个人爱好更加充分地了解客户的需要,根据各个细节市场,甚至是每一个顾客的独特需求提供个性化的产品,有利于提高客户的满意度。为了使网络信息挖掘技术更好地应用,商家必须记录访问者的特征及条款特征。当访问者访问某网站时,有关访问者的数据便会逐渐积累起来。

(2)发现潜在客户

对一个电子商务网站来说,了解、关注在册客户全体是非常重要的,但从众多的访问者中发现潜在客户群体也同样非常关键。如果发现某些客户为潜在客户群体,就可以对这类客户实施一定的策略,使他们尽快成为在册客户群体。在对客户访问记录的挖掘中,利于分类技术可以在网络上找到潜在客户。先对已经存在的访问者进行分类,一般分为三种:新来访者、偶然来访者和常客。对于新来访者,通过分类发现,识别出这个客户与已经分类的老客户的一些公共属性,从而对这个新客户进行正确的归类。然后根据归类判断,决定是否要把这个新来访者作为潜在的客户来对待。

(3)挽留老顾客

二八定律表明企业80%的业务收入来自于20%的客户,而向新客户进行推销的花费要6倍于向现有的客户进行推销的花费。通过Web数据挖掘,可发现什么样的顾客群在网站上购买了什么商品,哪些是网站的忠诚客户,以便对其进行个性化营销和人性化关怀。

(4)延长客户的驻留时间

为了使客户在自己的网站上驻留更长的时间,就应该了解客户的浏览行为,知道客户的兴趣及需求所在,动态地调整Web页面,以满足客户的需要。通过对客户访问信息的挖掘,就能知道客户的浏览行为,从而了解客户的兴趣及需求,并根据需求动态地向客户推荐页面,提供特有的一些商品信息和广告,以使客户能继续保持访问站点的兴趣。

(5)改进站点设计

站点上页面内容的安排就如超级市场中物品在货架上的摆设一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售,利用关联规则发现可以针对客户动态调整站点的结构,使客户访问的有关联的文件间的链接能够比较直接,让客户更容易访问到想访问的页面。网站如果具有这样的便利性,就能给客户留下较好的印象,增加了下次访问的几率。对Web站点链接结构的优化可从两方面来考虑:一是通过对Web日志的挖掘,发现用户访问页面的相关性,从而在密切联系的网页之间增加链接,方便用户的使用。二是通过对Web日志挖掘,发现用户的期望位置。如果在期望位置的访问频率高于对实际位置的访问频率,可考虑在期望位置和实际位置之间建立链接,从而实现对Web站点的优化。

(6)电子商务推荐系统

推荐系统就向客户推荐商品或提供信息来引导客户购买什么商品。推荐系统可以根据其他客户的信息或此客户的信息,模拟销售人员帮助客户完成购买过程,为客户提供个性化服务。推荐的形式包括向客户推荐商品,提供个性化的商品信息等。推荐系统具有如下作用:(1)将浏览者转变为购买者。有时人们只是看看网站的内容而没有购买的意思。推荐系统可以帮客户找到他们感兴趣的、愿意买的商品。(2)增加交叉销售。基于用户已经购买的商品,推荐客户购买一些相关的商品。(3)建立忠诚度。客户往往愿意到那些最能满足自己需求的网站购物。

3、实例:顾客行为模式分析

由于数据挖掘技术一般不是在线创建模型,因此首先要将诸如会员基本信息、会员在线消费文档、会员在线行为文档\服务器认证日志等所有的相关数据从服务器上下载下来,并按照以下步骤处理这些数据。

(1)数据聚合与过滤

在这一步中,从不同的文档聚集所有数据汇成一组基本数据记录,在聚集的处理过程中,这些信息中有错误和漏掉的部分都需要得到修正。例如在信息提取的过程中,遇到购买为零时会导致空白,因此需填充缺省值来处理空白。然后将与该模式无关紧要的栏消去。例如,消去顾客的ID栏,因为它自始至终对于顾客行为模式没有任何作用。

(2)数据整合

预处理过的数据才可被挖掘工具进行整合。要注意数据挖掘工具只能处理数字,因此文字数据就要提前处理转化出来。不同的数据挖掘工具可能采用不同的挖掘技术,如有的可利用遗传算法,有的则可采用神经网络技术等等。因此,得出的结论也可能会因为数据整合的方法不同而有差别。以下是两个实例,表4-1是提取和过滤过的会员数据,表4-2是分析的顾客行为模式。

表4-1会员数据

NO.

性别

职业

年龄

IP

停留时间(分)

购物时间(年)

消费总计

购买的产品

1

2

3

4

5

student

IT

student

clerk

doctor

22

35

24

28

32

12.23

33.27

23.46

52.12

40.06

34

58

24

82

40

3

6

2

5

4

566

340

454

531

480

A

B

C

A

D

表4-2顾客行为模式

依据购物的时间

依据消费总计

依据购买的商品

Ifuser’ssexisfemaleanduser’soccupationisstudent

Thenthisuser’sformerpurchasestimeis3

Ifuser’ssexismaleanduser’soccupationisITprofessionalanduser’sIPis33.27

Thenthisuser’sformerpurchasesis6

(二)网络信息挖掘在网络广告分析中的应用

网络广告是指在Internet站点上的,数字化格式的各种经营性广告。网络广告一般是指多媒体广告,能将文字、图像和声音有机的组合在一起,传递多种感官的信息,让顾客如身临其境,感受商品或服务。这种图、文、声、像相结合的广告形式,将大大增强网络广告的实效。

对于网站来说,它必须意识到一个成功的网络广告不仅仅找到一个业主,为它放上一个超链接这么简单,要想让广告主看到成效、增加宣传费,除了网站要完善自身建设,扩大用户群外,还应主动向广告主提供用户信息,由于点击广告的用户基本上是对此产品有兴趣的潜在顾客,因此,广告主也愿意付出较高的费用。网站要想长期大量的而拥有广告主的投资,利用数据文件技术为广告主提供细致周到的服务至关重要。数据挖掘技术在商业领域的成功应用,文件算法的日趋成熟,都为网站提供这种服务创造了条件。

网络信息挖掘技术主要分为三个阶段:数据准备、挖掘操作、结果表达。就数据准备而言,网络广告主所需的数据主要来自两个方面:一方面是用户的背景信息,这部分信息主要来自于用户的登记表;而另一部分数据主要来自于用户的点击流,这部分信息主要来自于用户的行为表现。人们在访问某网站的同时,便提供了个人对网站内容的反馈信息:点击了哪一个链接,在哪里浏览时间最多,用了哪个搜索项、总体浏览时间、个人姓名和住址等。所有这些信息都被保存在一个数据库中,生成大量的记录文件和登记表,利用这些数据进行分析、挖掘,充分了解用户的喜好、购买模式,不仅可以使网站设计出满足不同用户群体需要的个性化网页,增加竞争力,而且可以为广告主提出行之有效的广告方案,实现商家渴望的个性化市场营销。在数据准备阶段一定要保证数据的质量和时效性,这是数据挖掘成功与否的关键。不同的问题需要用不同的方法去解决,即使对于同一个问题,也肯定有多种算法。目前有很多厂商正在开发专门用于网站挖掘的软件,可以根据网络用户浏览广告时留下的个人信息,利用基于数据挖掘的概率知识库和模糊知识库,对信息进行概率分析,通过对广告访问者潜在的信息特征进行模糊划分,判断哪些网络用户是本产品的真正客户,而不是一般性的浏览访问者,从而为厂家组织生产和商家营销计划提供科学的决策信息。

利用网络数据挖掘,广告主可以通过网站提供的用户信息,有的放矢地发送广告。可见网络公司在已有的条件下,加大数据分析力度,无论是对自身发展还是个广告主的宣传都是有利策略。当然,数据挖掘技术并不能包治百病,要想获得最佳的网络广告效果,不仅与网络广告投放的位置,所选网站的日常浏览量,广告自身的视觉效果等密切相关,还有许多其他的影响因素。而且,就数据挖掘而言,也不应把它看得过分神秘,认为只要有了一个数据挖掘工具,就能自动挖掘初所需要的信息,能更好地进行企业、商业运作,这是认识上的误区。其实,要想真正做好数据挖掘,工具只是其中的一个方面,同时还需要对企业、企业业务的深入了解和数据分析经验。无论是企业还是网站要想在未来的市场中具有竞争力,必须有些数据挖掘方面的专家,专门从事数据分析和数据挖掘工作。在同其他部门协调,才能做到量身定做广告。

(三)网络信息挖掘在竞争情报工作中的应用

1、网络信息挖掘在竞争情报工作中的作用

竞争情报是指通过合法手段收集和分析商业竞争中有关商业行为的优势、劣势和机会的信息。互联网为竞争情报工作提供了丰富的信息资源,但是没有一个很好的网络信息挖掘工具很难获取其中有价值的信息。随着商业竞争的日益激烈,各个企业都纷纷建立了自己的竞争情报系统,以提高自身的竞争力。尤其是在网络环境下,谁忽视了网络信息资源的开发与利用谁就已经失去了领先的机会。在企业竞争情报工作中有两个重要方面,就是获取竞争对手和客户的信息。随着互联网在企业中应用的不断深入,从网上可挖掘的企业信息越来越多,涉及的内容也越来越广泛。从网络信息挖掘技术的实现流程来看,网络信息挖掘不仅仅是像网络信息检索那样只是把符合查询要求的记录返回给用户,这样得到的结果集不仅数量庞大,而且包括很多不相关信息。正如前面所提到的,网络信息挖掘不仅能够从WWW的大量的数据中发现信息,而且它还能发现权威站点、有重要价值的“隐藏”信息,并且能够监视和预测用户的访问习惯,这对于企业开展竞争情报工作是非常重要的。

2、网络信息挖掘在竞争情报搜集和处理中的应用

随着互联网在企业中应用的不断深入,从网上可挖掘的企业信息越来越多,涉及的内容也越来越广泛。通过网络信息的数据挖掘可以从大量完整、彼此关系不明确的敏感信息中找出隐含的和事先未知的有用信息,揭示数据内在的复杂性,帮助情报人员进行深层次的分析,获得更多的、更有价值的竞争情报。

(1)充分获取、开发和利用竞争对手和客户的信息

网络信息挖掘不仅能够从Web的大量的数据中发现信息,而且能够发现权威站点、有重要价值的“隐藏”信息,并且能够监视和预测用户的访问习惯、购买行为,发现顾客购买模式趋势。

(2)挖掘Web日志记录来发现用户访问Web页面的模式

通过分析和研究Web日志记录中的规律,可以识别电子商务潜在客户,增强对最终用户的互联网信息服务的质量,并改进Web服务器的性能。

(3)网络信息挖掘在反竞争情报子系统中的应用

反竞争情报子系统是企业竞争情报活动的重要组成部分,忽视竞争对手的竞争情报活动,低估竞争对手搜集竞争情报的能力势必导致企业失去已有的竞争优势。Web站点是企业与外界进行交流的窗口,同时也是竞争对手获取竞争情报的一个重要信息源,因此,对它进行监控是企业了解竞争对手的竞争情报的重要途径。在竞争情报计算机系统中,可以充分利用Web挖掘技术,通过运用分析访问者的Ip地址、客户端所属域、访问路径分析等Web监控技术、统计敏感信息访问率等方法实现对竞争对手的防范,以达到识别竞争对手保护企业敏感信息的目的。

结论

网络信息挖掘是网络信息处理领域中的一项新技术,是指在大量训练样本的基础上,得到数据对象间的内在特性,并以此为依据在网络资源中进行有目的的信息提取。网络信息挖掘是数据挖掘技术在网络信息处理中的一个重要应用,也是一项崭新的研究课题。随着Internet的迅速发展和不断的普及应用,网络信息资源越来越丰富,如何分析和利用这些海量的数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和广阔的应用前景。

参考文献.

[1]冯艳.数据挖掘技术在电子商务上的应用[J].湖南商学院学报.2002,19(2):125-126.

[2]郝先臣.数据挖掘工具和应用中的问题[J].东北大学学报.2001,22(2):183-186.

[3]董慧等.网络信息资源开发及利用[M].武汉:武汉大学出版社,2001:116-187.

[4]王娜.网络信息资源挖掘研究概述[J].图书馆学刊.2007(1):123-124.

[5]南京航空航天大学图书馆.网络信息采集与应用[M].北京:清华大学出版社,2005:86-88.

[6]李村合.网络信息挖掘技术及其应用研究[J].情报科学.2002,20(11):1212-1214.

[7]宋瑞祺.Web文本数据挖掘关键技术及其在网络检索中的应用[J].山西财经大学学报.2007,10(1):95-96.

[8]陈萍丽.Web挖掘及其在竞争情报系统的应用[J].情报科学.2003,21(9):998-1001.

[9]陈敏.数据采掘与信息资源的开发利用[J].现代图书情报技术.2001(2):27-34.

[10]张燕.浅谈网络信息挖掘[J].情报探索.2000(4):34-36.

[11]徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报.2001,24(4):430-436.

[12]黄晓斌.网络信息挖掘[M].北京:电子工业出版社,2007:159-213.

[13]姜东琳.网络信息挖掘技术及应用[J].计算机技术.2005(3):52-58.

[14]柯平,高洁.信息管理概论[M].北京:科学出版社,2002:60-62.

[15]JiaweiHan,MichelineKambr.DataMining:ConceptsandTechniques[M].北京:高等教育出版社,2001:107-246.

[16]YimingMa.WebforDataMining[J].SIGKDDExplorations.2000,2(1):16-23.