mulan:mulan.data.DataLoadException:从提供的Reader数据源创建实例数据时出错:索引超出范围,读取Token [1080],第1085行

我正在尝试获取一些多标签数据集,其中一个是“ Language Log”数据集,其URL为“ http://waikato.github.io/meka/datasets/”。该数据集的详细信息如下所示:

@relation 'LangLog: -C 75'

@attribute Errors {0,1}
@attribute Humor {0,1}
@attribute Speech_acts {0,1}
@attribute Prescriptivist_Poppycock {0,1}
@attribute Phonetics_and_phonology {0,1}
@attribute Punctuation {0,1}
@attribute Administration {0,1}
@attribute Language_and_culture {0,1}
@attribute This_blogging_life {0,1}
@attribute Ignorance_of_Linguistics {0,1}
@attribute HLT {0,1}
@attribute Announcements {0,1}
@attribute Syntax {0,1}
....
@attribute tok1 numeric
@attribute tok2 numeric
@attribute tok3 numeric
@attribute tok4 numeric
@attribute tok5 numeric
@attribute tok6 numeric
@attribute tok7 numeric
@attribute tok8 numeric
@attribute tok9 numeric
@attribute tok10 numeric
@attribute tok11 numeric
@attribute tok12 numeric
@attribute tok13 numeric
@attribute tok14 numeric
@attribute tok15 numeric
@attribute tok16 numeric
@attribute tok17 numeric
@attribute tok18 numeric
@attribute tok19 numeric
@attribute tok20 numeric
.....

@data
{32 1,60 1,99 1,154 1,202 1,220 1,225 1,256 1,274 1,405 1,459 1,461 1,632 1,688 1,714 1,778 1,789 1,793 1,831 1,836 1,845 1,973 1,995 1,1021 1,1029 1,1046 1}

但是现在我有一个问题,如您所见,标签部分显示在功能部分之前,因此我编写了代码以转换顺序(因为我的多标签算法需要)。像这样的数据:

@relation 'LangLog: -C 75'

@attribute tok0 numeric
@attribute tok1 numeric
@attribute tok2 numeric
@attribute tok3 numeric
@attribute tok4 numeric
@attribute tok5 numeric
@attribute tok6 numeric
@attribute tok7 numeric
@attribute tok8 numeric
@attribute tok9 numeric
@attribute tok10 numeric
@attribute tok11 numeric
@attribute tok12 numeric
@attribute tok13 numeric
@attribute tok14 numeric
@attribute tok15 numeric
@attribute tok16 numeric
@attribute tok17 numeric
@attribute tok18 numeric
@attribute tok19 numeric
@attribute tok20 numeric
@attribute tok21 numeric
...
@attribute tok1002 numeric
@attribute tok1003 numeric
@attribute Errors {0,1}
...

@data
{24 1,79 1,127 1,145 1,150 1,181 1,199 1,330 1,384 1,386 1,557 1,613 1,639 1,703 1,718 1,756 1,761 1,770 1,898 1,920 1,946 1,954 1,971 1,1036 1,1064 1}

但是,当我使用mulan中的数据集对算法进行实验时,会出现以下问题:mulan.data.DataLoadException:从提供的Reader数据源创建实例数据时出错:索引超出范围,读取了令牌[1080],第1085行

有人可以告诉我原因是什么吗?

fajkasjifise 回答:mulan:mulan.data.DataLoadException:从提供的Reader数据源创建实例数据时出错:索引超出范围,读取Token [1080],第1085行

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3146678.html

大家都在问