• 图片出处
文献标题: 一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究
文献来源: 乔建忠;  现代图书情报技术  2012年  06期
文献关键词: 相关性判断策略主题爬行器主题搜索数字图书馆
文献摘要: 为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。
全文图片
  • 正在努力加载………
    加载完成