在dask中为行创建唯一的ID 2024-05-17 • 问答 我需要为dask数据框中的行添加一个id,我尝试做的第一件事是添加一个累积索引,如其他question 所示 df["idx"] = 1 df["idx"] = df["idx"].cumsum() 但是我的笔记本电脑崩溃了,所以也许可以选择一个随机的唯一ID 作为其他信息,我正在使用10GB的镶木地板格式文件和20Gb的CSV文件,而我的笔记本电脑具有16Gb的RAM 如果可能的话,我不知道的另一种选择是将新列追加/添加到文件中而不将其加载到内存中 clshz2009 回答:在dask中为行创建唯一的ID 我会找出一些针对Pandas的代码,然后使用map_partitions方法来并行应用相同的功能。也许像下面这样? def add_unique_id_column(df: pandas.DataFrame) -> pandas.DataFrame: ... df = df.map_partitions(add_unique_id_column) daskpyarrow 本文链接:https://www.f2er.com/2830081.html 大家都在问 已解答将 Python 程序转换为 C/C++ 代码?2023-03-20 已解答模块化算法和 NTT(有限域 DFT)优化2023-03-20 已解答初始化是否需要左值到右值的转换?是`int x = x;` UB 吗?2023-03-20 已解答cout<<调用它打印的函数的顺序?2023-03-20 已解答C++11 中 COW std::string 实现的合法性2023-03-20 已解答为什么我不能将 unique_ptr 推回到向量中?2023-03-20 已解答std::vector::resize() 与 std::vector::reserve()2023-03-20 已解答extern inline 有什么作用?2023-03-20 已解答在这种特定情况下,使用成员初始值设定项列表和在构造函数中赋值之间有区别吗?2023-03-20 已解答为什么模数除法 (%) 仅适用于整数?2023-03-20 已解答在 C++ 中测量函数的执行时间2023-03-20 已解答如何使用 Code::Blocks 链接到库?2023-03-20 已解答C++ 中的 int 和 long 有什么区别?2023-03-20 已解答如何将cin和cout重定向到文件?2023-03-20 已解答优化掉一个“while(1);"在 C++0x2023-03-20 已解答如何在只有受保护或私有构造函数的类上调用 ::std::make_shared?2023-03-20