专利检索与分析系统
|
意见反馈
|
制图工具
公告: 1.点击检索输入框上方可切换相似检索,上传图片可查找该图片的相似图片。 2.
专利检索与分析系统上线,欢迎试用。
登 录
注册
欢迎您:
未登录
退出
到登录页
图片搜索
相似搜索
检索
高级检索
图片主题:
请以;隔开多个主题词
出版日期:
到
图片类别:
学科类别:
图片大小:
全部
大
中
小
来源数据库:
全部
中国学术期刊网络出版总库
中国博士学位论文全文数据库
中国优秀硕士学位论文全文数据库
中国重要会议论文全文数据库
中国工具书网络出版总库
中国年鉴全文数据库
学术知识图片库
>
互联网技术
> 训练算法流程
训练算法流程
图片来源:
乔建忠.
一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究 ,
现代图书情报技术, 2012 (06).
>>查看本文图片摘要
图片关键词:
流程
训练算法
样本数量
分类器
所属学科:
互联网技术
图片上下文:
、Na-iveBayes[14]、J48[15]和ZeroR[16]。4算法设计本文在设计分类算法时采用训练与分类兼顾的做法。在训练阶段利用特征样本专门训练相应的分类器,而在分类阶段采用增量学习的算法,另外从训练向分类转换也有专门的设计,算法分三个步骤:(1)在分类前需要为专门的
....
分类器建立初始训练数据集。训练集的样本数量取决于两个方面:类目数量,需保证每种类目的样本占有彼此相等的数量;分类评估的结果,依据分类准确率,确定样本数量,同时兼顾分类效率,样本数量不能太大。训练算法流程如图1所示:图1训练算法流程训练的结果是生成分类器对应的向量分类模型文件。向量分类模型文件采用WEKA默认的ARFF格式文件保存。例如系统中采用的类型分类样本集文件内容和格式如下:@relation'InternetDocumentTypeClassificationProblem'@attributedepthnumeric@attributelinknumnumeric@attributepagelenghnumeric@attributemediasizenumeric@attributesentencemeanlengthnumeric@attributetitlelengthnumeric@attributeanchortofullrationumeric@attributeanchormeanlengthnumeric@attributeclass{A01001,A01002,A01003,A01004,A01005,A02001}@data0,266,3178,200,127,45,0.148206,1,A010050,66,3047,28,179,39,0.136856,6,A010050,74,3172,35,126,66,0.075347,3,A010051,521,8090,410,124,45,0.102719,1,A010051,59,2521,31,100,93,0.198334,8,A010050,610,5920,118,740,7,0.81723,7,A010031,605,5865,117,733,7,0.816198,7,A010030,431,3225,66,0,15,0.803411,6,A020010,190,1386,9,693,14,0.830447,6,A020010,1
>>展开全部
相关图片
同文图片
语义相关
读者推荐
相似图片
浏览历史
本单位未订购此产品,请填写调查问卷可
免费获取
下载权限.
京 ICP 证 040431 号
网络出版服务许可证 (总)网出证(京)字第 271 号
经营性网站备案信息
京公网安备 11010802020460 号
《中国学术期刊(光盘版)》电子杂志社有限公司
KDN 平台基础技术由 KBASE 11.0 提供. © 1998-2021 中国知网(CNKI)
用户手册
|
产品标准
|
数据标准
|
图片分类说明