成功,从小事做起。


使用最大熵模型进行中文文本分类

上一篇 / 下一篇  2009-02-20 17:30:23 / 个人分类:分类聚类

  • 文件大小: 109 KB
  • 开发商: 李荣陆,王建会,陈晓云,陶晓鹏,胡运发
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于最大熵模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果.但是,将最大熵模型应用在文本分类中的研究却非常少,而使用最大熵模型进行中文文本分类的研究尚未见到.使用最大熵模型进行了中文文本分类.通过实验比较和分析了不同的中文文本特征生成方法、不同的特征数目,以及在使用平滑技术的情况下,基于最大熵模型的分类器的分类性能.并且将其和Bayes,KNN,SVM三种典型的文本分类器进行了比较,结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法.
点击下列原文下载

TAG: 分类 最大熵

sonnyjou的个人空间 引用 删除 sonnyjou   /   2009-02-21 16:02:41
这个算法是分词中最经典的了
 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2010-07-29  
    123
45678910
11121314151617
18192021222324
25262728293031

数据统计

  • 访问量: 10085
  • 日志数: 5
  • 文件数: 211
  • 书签数: 8
  • 建立时间: 2008-12-11
  • 更新时间: 2009-04-10

RSS订阅

Open Toolbar