如何使用TF-IDF模型从文档中查找“缺失”或代表性不足的单词? 2024-06-02 • 问答 我专门使用gensim来构建Tfidfmodel,但我相信这更多是TF-IDF的一般问题... 假设我用10个文档构建了TF-IDF模型。如何使用此模型来检测模型中高价值的单词,但在特定的可见或不可见文档中代表性不足的单词? 例如,如果文档1-9都频繁使用“香蕉”一词,那么我怎么才能发现文档10(或未用于构建模型的文档)根本没有使用它呢? 我知道我可以从模型中提取单词和值的字典并进行自己的比较,但是我想知道是否有更好的方法。 lili1030 回答:如何使用TF-IDF模型从文档中查找“缺失”或代表性不足的单词? 暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com data-sciencegensimnlptf-idf 本文链接:https://www.f2er.com/2844240.html 大家都在问 已解答将 Python 程序转换为 C/C++ 代码?2023-03-20 已解答模块化算法和 NTT(有限域 DFT)优化2023-03-20 已解答初始化是否需要左值到右值的转换?是`int x = x;` UB 吗?2023-03-20 已解答cout<<调用它打印的函数的顺序?2023-03-20 已解答C++11 中 COW std::string 实现的合法性2023-03-20 已解答为什么我不能将 unique_ptr 推回到向量中?2023-03-20 已解答std::vector::resize() 与 std::vector::reserve()2023-03-20 已解答extern inline 有什么作用?2023-03-20 已解答在这种特定情况下,使用成员初始值设定项列表和在构造函数中赋值之间有区别吗?2023-03-20 已解答为什么模数除法 (%) 仅适用于整数?2023-03-20 已解答在 C++ 中测量函数的执行时间2023-03-20 已解答如何使用 Code::Blocks 链接到库?2023-03-20 已解答C++ 中的 int 和 long 有什么区别?2023-03-20 已解答如何将cin和cout重定向到文件?2023-03-20 已解答优化掉一个“while(1);"在 C++0x2023-03-20 已解答如何在只有受保护或私有构造函数的类上调用 ::std::make_shared?2023-03-20