竹坞无尘水槛清,相思迢递隔重城。 秋阴不散霜飞晚,留得枯荷听雨声。


搜索引擎技术中的Web结构挖掘算法研究

上一篇 / 下一篇  2009-04-28 13:39:36 / 个人分类:信息抽取

【英文题名】The Algorism Research on the Web Structure Mining in the Search Engine Technology
【作者】陈鑫卿;
【导师】张永奎;
【学位授予单位】山西大学;
【学科专业名称】计算机应用技术
【学位年度】2003
【论文级别】硕士
【网络出版投稿人】山西大学
【网络出版投稿时间】2003-10-24
关键词Web挖掘;Web结构挖掘;搜索引擎;权威;枢纽;
【英文关键词】Web mining;Web structure mining;search engines;authoritative;hub.;
【中文摘要】今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询。很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹配的Web网页的序列。对于宽话题查询,这样的搜索引擎经常得到一个较大的含有相关文档的集合,这些文档大多数是用户不感兴趣的。 然而,Web网页中存在着丰富的超链接结构信息,利用Web结构挖掘技术可以从中挖掘出有用的信息来改进搜索引擎技术。在这种情况下,Jon Kleinberg(在他的论文Authoritative sources in a hyperlinked environment)介绍了下面的概念: 1.权威网页——包含与查询匹配的网页中最具有权威性的网页的一个小的子集,该集合中的网页有很多入链接。 2.枢纽页——那些指向多个权威网页的网页。 Kleinberg认为权威和枢纽之间有一种相互加强的关系:好的枢纽指向好的权威,而好的权威被好的枢纽所指向,并根据这种关系设计了一种计算权威网页的Hub/authority算法。Brin和Page也提出了...
【英文摘要】Today, when searching for information on the Web, one usually performs a query through a search engine. Many search engine are term-based, and return, a list of Web pages whose content match the query. For wide topic queries, such searches often result in a huge set of retrieved documents, Many of which are irrelevant to the user. However, much information is contained in the link-structure of the Web pages, from which people can find much useable information through Web structure minin...
点击下列原文下载

TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2010-07-29  
    123
45678910
11121314151617
18192021222324
25262728293031

数据统计

  • 访问量: 6910
  • 日志数: 19
  • 文件数: 198
  • 书签数: 33
  • 建立时间: 2009-01-17
  • 更新时间: 2009-07-19

RSS订阅

Open Toolbar