竹坞无尘水槛清,相思迢递隔重城。
秋阴不散霜飞晚,留得枯荷听雨声。
搜索引擎技术中的Web结构挖掘算法研究
上一篇 /
下一篇 2009-04-28 13:39:36
/ 个人分类:信息抽取
| 【英文题名】 | The Algorism Research on the Web Structure Mining in the Search Engine Technology |
| 【作者】 | 陈鑫卿; |
| 【导师】 | 张永奎; |
| 【学位授予单位】 | 山西大学; |
| 【学科专业名称】 | 计算机应用技术 |
| 【学位年度】 | 2003 |
| 【论文级别】 | 硕士 |
| 【网络出版投稿人】 | 山西大学 |
| 【网络出版投稿时间】 | 2003-10-24 |
| 【关键词】 | Web挖掘;Web结构挖掘;搜索引擎;权威;枢纽; |
| 【英文关键词】 | Web mining;Web structure mining;search engines;authoritative;hub.; |
| 【中文摘要】 | 今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询。很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹配的Web网页的序列。对于宽话题查询,这样的搜索引擎经常得到一个较大的含有相关文档的集合,这些文档大多数是用户不感兴趣的。 然而,Web网页中存在着丰富的超链接结构信息,利用Web结构挖掘技术可以从中挖掘出有用的信息来改进搜索引擎技术。在这种情况下,Jon Kleinberg(在他的论文Authoritative sources in a hyperlinked environment)介绍了下面的概念: 1.权威网页——包含与查询匹配的网页中最具有权威性的网页的一个小的子集,该集合中的网页有很多入链接。 2.枢纽页——那些指向多个权威网页的网页。 Kleinberg认为权威和枢纽之间有一种相互加强的关系:好的枢纽指向好的权威,而好的权威被好的枢纽所指向,并根据这种关系设计了一种计算权威网页的Hub/authority算法。Brin和Page也提出了... |
| 【英文摘要】 | Today, when searching for information on the Web, one usually performs a query through a search engine. Many search engine are term-based, and return, a list of Web pages whose content match the query. For wide topic queries, such searches often result in a huge set of retrieved documents, Many of which are irrelevant to the user. However, much information is contained in the link-structure of the Web pages, from which people can find much useable information through Web structure minin... |
收藏
分享给好友
管理
举报
TAG: