猪猪淘券

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 471|回复: 0

评估是确定能够以最高精

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-8-2 19:30:27 | 显示全部楼层 |阅读模式
A 和 RNS 的总共 1700 个摘要。测试集包含 RNAi 类中的 101 个 RNAi 摘要和 Non_RNAi 类中的药物、药物-药物、NA 和 RNS 总共 1700 个摘要。 表1 用于测试各种weka分成 全尺寸桌子 算法的选择 度执行给定任务的最佳分类器的关键。由于训练和测试的数据量有限,选择 10 倍分层交叉验证作为评估各种分类器的最合适方法。使用以下 7 个分类器对数据集进行评估

,即 ZeroR、NaiveBayes、K 最近邻、J48、随机森林、支持向量机和 OneR。这些是一些最常用的文本分类算法,除了此处用于获取基线的 ZeroR 之外。属于 WEKA 的过滤分类器 [ 32] 使用元分类器,因为它具有同时Telegram 用户号码列表选择分类器和过滤器来评估模型的优点。上面提到的各种分类器与字符串到词向量过滤器一起进行了测试。字符串到单词过滤器将字符串属性转换为一组属性,这些属性表示字符串

中包含的文本中出现的单词。属性集是根据训练数据集确定的。选择 10 倍分层交叉验证选项,并对来自训练集的数据(表1)进行评估以确定最佳分类器。 训练和测试模型 根据上述5个模型的分类准确率,选择前三个模型进行训练和测试。这些模型经过训练,然后在表1所示的数据集上进行测试。选择性能最高的模型,即在第 4 组上训练的 SMO (SMO-4) 作为在




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|DiscuzX ( 苏ICP备17010151号-2 )

GMT+8, 2024-5-14 15:15 , Processed in 0.056781 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表