成功,从小事做起。


Web数据挖掘和个性化搜索引擎研究-中

上一篇 / 下一篇  2009-02-13 20:48:58 / 个人分类:数据处理

  • 文件大小: 1.49 MB
  • 开发商: 来源网络
  • 文件来源: 网络
中文摘要: Web已成为人们获取信息的一个重要途径,随着Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息。搜索引擎随之成为人们最普遍使用的信息检索的工具。该工具涉及到信息检索、数据库、数据挖掘、人工智能、分布式处理、自然语言处理等多个领域的理论和技术,因而具有综合性和挑战性。但是,目前大多数的搜索引擎提供的服务还不能令用户满意,尤其是个性化的查询请求。因此,个性化搜索引擎成为当前的一个重要研究课题。 本文针对目前搜索引擎存在的不足,充分研究了个性化搜索引擎的发展现状,设计并实现了一种个性化搜索引擎,同时提出了一种查询语句优化策略,在此基础上,又对基于语义Web的搜索引擎进行了研究探索。 本文的主要工作如下: ● 对信息检索技术、搜索引擎的工作流程、发展历史、现状和存在问题进行了简要综述。 ● 对个性化搜索引擎相关技术—Web数据挖掘进行了研究。 ● 对个性化搜索引擎的研究现状进行了总结,并设计了个性化搜索引擎模型。 ● 提出了一种查询语句优化策略。 ● 对语义Web进行了简要综述,设计了一个基于语义Web的搜索引擎。...
英文摘要: Web is becoming one of the important information resources. With the rapid increase of information in Web, people have to waste much time to search the information they need. So the search engine has become the most popular information retrieval tool. Because it relates to the theory and technology of Information Retrieval, Database, Data Mining, Artificial Intelligence, Distributed Processing, Natural Language Processing etc, it is an all-around and challenging research. Nevertheless, for most search engin...
目录:摘要 3-4
Abstract 4
目录 5-7
第1章 绪论 7-16
    1.1 序言 7
    1.2 信息检索 7-8
    1.3 Web信息搜索 8
    1.4 搜索引擎综述 8-14
        1.4.1 搜索引擎的工作流程 8-10
        1.4.2 搜索引擎的发展历史 10-13
        1.4.3 搜索引擎存在的问题 13-14
    1.5 本文的工作和论文组织 14-16
第2章 Web数据挖掘研究 16-26
    2.1 Web内容挖掘 16-21
        2.1.1 定义 16-17
        2.1.2 目前采用的主要算法 17-18
        2.1.3 结合人工智能、模式识别等技术的Web内容挖掘 18-20
        2.1.4 Web内容挖掘现状总结 20-21
    2.2 Web结构挖掘 21-23
        2.2.1 定义 21
        2.2.2 应用 21
        2.2.3 Web链接挖掘算法 21-23
    2.3 Web使用挖掘 23-26
        2.3.1 定义 23-24
        2.3.2 挖掘过程和算法 24-26
第3章 个性化搜索引擎模型 26-35
    3.1 个性化搜索引擎的研究现状 26-27
    3.2 个性化搜索引擎模型设计 27-31
        3.2.1 GENERAL查询 27
        3.2.2 PERSONALIZED查询 27-29
        3.2.3 EXPERT查询 29
        3.2.4 INTELLIGENT查询 29-31
        3.2.5 用户查询结果的聚集 31
    3.3 一种查询语句优化策略 31-35
        3.3.1 页面关键词集合的提取 31-32
        3.3.2 用户词典 32-33
        3.3.3 用户兴趣模型 33
        3.3.4 关键词扩充算法 33-34
        3.3.5 搜索应用举例 34-35
第4章 基于语义网的搜索引擎探索 35-46
    4.1 什么是语义Web 35-36
    4.2 语义Web的组成 36-41
        4.2.1 URIs和Unicode 36-37
        4.2.2 XML/NameSpace/XML Schema 37
        4.2.3 RDF/RDF Schema 37-39
        4.2.4 本体(Ontology) 39-40
        4.2.5 Logic,Proof & Trust 40-41
    4.3 基于语义Web的信息获取 41-42
    4.4 基于语义Web的搜索引擎设计 42-46
        4.4.1 语义Web在检索中的作用 42
        4.4.2 语义Web的网页标记语言 42-43
        4.4.3 基于语义Web搜索引擎的系统框架 43-44
        4.4.4 本体的建立 44-45
        4.4.5 基于语义Web搜索的过程 45-46
第5章 个性化搜索引擎Cgoo的系统实现 46-54
    5.1 系统结构 46-47
    5.2 网络蜘蛛 47-48
        5.2.1 Spider搜索常用策略 47-48
        5.2.2 Cgoo之spider的搜索策略 48
    5.3 系统实现 48-54
        5.3.1 用户查询接口 48-49
        5.3.2 用户注册 49-50
        5.3.3 个性化的拖动条 50-51
        5.3.4 查询结果聚集 51
        5.3.5 个性化查询 51-54
第6章 总结与展望 54-56
    6.1 工作总结 54
    6.2 进一步的工作 54-55
    6.3 未来展望 55-56
参考文献 56-60
致谢 60
点击下列原文下载

TAG: 个性化 搜索引擎 数据挖掘

引用 删除 chu_chu   /   2009-12-30 13:15:45
good man
引用 删除 djcs175523   /   2009-07-30 22:20:54
真是个好博客!!
支持一下!!!
 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2010-07-29  
    123
45678910
11121314151617
18192021222324
25262728293031

数据统计

  • 访问量: 10085
  • 日志数: 5
  • 文件数: 211
  • 书签数: 8
  • 建立时间: 2008-12-11
  • 更新时间: 2009-04-10

RSS订阅

Open Toolbar