spark-koalas

无法对考拉数据框执行操作

<pre><code>import databricks.koalas as ks df = ks.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6]}) df.columns = [

前端之家
2022-08-16 • 问答
使用RGB值调用koalas.hist（）时如何更改颜色

我有一个考拉数据框。我想绘制一个直方图，但我想使用RGB元组（r，g，b）更改颜色。如何更改下面的

前端之家
2022-08-16 • 问答
PySpark无法在Koalas DataFrame中计算列式标准差

我在PySpark中有一个Koalas DataFrame。我想计算列标准偏差。我已经尝试过： <pre><code>df2['x_std'] = df

前端之家
2022-08-16 • 问答
如何在考拉中将具有空值的数据帧转换为csv？

当我在<code>to_csv</code>中使用<code>koalas</code>将数据帧转换为CSV时，空值填充为<code>\"\"</code>，但我

前端之家
2022-08-12 • 问答
使用分配在Koalas DataFrame中添加新列

我有一个Koalas DataFrame，我想通过使用两列进行计算来添加新列。我有一个单独的函数来执行计算，并为

前端之家
2022-08-09 • 问答
无法在考拉中加载JSON文件，导致连接被拒绝错误

<strong>问题描述</strong> 我尝试使用<code>koalas</code>加载JSON文件，但是它抛出连接拒绝错误。如果

前端之家
2022-08-01 • 问答
使用Databricks连接器在PyCharm中导入考拉时出错（Python 3.7）

当我尝试从数据块导入考拉时，我看到以下错误。我正在使用pyspark v2.4.5，并且能够成功连接到我的Spark

前端之家
2022-07-18 • 问答
Koalas / pandas_wraps无法返回列表

我正在学习考拉，并尝试转换一些现有的熊猫代码。我们使用的一种常见模式是<code>column.map(lambda x: x...)

前端之家
2022-07-16 • 问答
考拉groupby-> Apply返回'无法插入“键”，已经存在”

我一直在努力解决这个问题，但仍无法解决，因此获得了当前数据框： <pre class="lang-py prettyprint-overri

前端之家
2022-07-16 • 问答
Databricks Koalas：使用for循环创建具有条件的新列，并根据旧列名动态命名新列

示例数据集： <pre><code>kdf = ks.DataFrame({"power_1": [50, 100, 150, 120, 18], "power_2":

前端之家
2022-07-14 • 问答
Databricks Koalas无法导入镶木地板文件

当从Azure数据湖将镶木地板文件导入数据砖时，我遇到了错误。 <a href="https://i.stack.imgur.com/r0frz.png" rel="no

前端之家
2022-07-12 • 问答
在考拉中填充数据时间戳中的缺失值？

我在考拉数据框中的日期时间列中缺少值， <pre><code>cleaned_Data['Valuation_Date'].head() (1) Spark Jobs Ou

前端之家
2022-07-07 • 问答
考拉applymap将所有数据移动到单个分区

我需要对Koalas DataFrame进行逐元素操作。我为此使用了考拉<a href="https://koalas.readthedocs.io/en/latest/reference/ap

前端之家
2022-06-26 • 问答
包含.iloc的代码不适用于Koalas数据框

<pre><code>student1 = ("Allan", "Anderson") student2 = ("Barry", "Byars") student = [student1, student2] pr

前端之家
2022-06-23 • 问答
如何安装Spark 2.4的考拉？

我想在pyspark上运行我的熊猫代码，但是为此我需要考拉。如何在Spark 2.4上安装和使用考拉

前端之家
2022-06-22 • 问答
Koalas Group通过>应用> Lambda>系列

我试图将一些代码从Pandas移植到Koalas，以利用Spark的分布式处理。我正在获取一个数据框并将其分组在A

前端之家
2022-06-12 • 问答
koalas列分配不支持ndarray类型

全部-我正在尝试向现有考拉数据框添加新列，但失败，并显示上述错误。我要分配的值是一个np数组。

前端之家
2022-06-11 • 问答
填充和插值考拉数据框

是否可以像这样插入和填充Koalas数据框中的不同列？ <pre><code>%%spark -s sparkenv2 kdf = ks.DataFrame({ '

前端之家
2022-06-03 • 问答
熊猫resample（'D'）方法的Spark / Koalas实现

我有一个Spark数据框，需要填写。数据框的大小很大（> 1亿行）。如下所示，我可以使用熊猫实现我想要

前端之家
2022-06-03 • 问答
如何将熊猫数据框转换为具有混合数据类型的考拉

我正在使用Azure Databricks将熊猫数据框转换为考拉数据框... <pre><code>kdf = ks.DataFrame(pdf) </code></pre> 这

前端之家
2022-05-31 • 问答
如何创建空的考拉df

我正在尝试使用以下命令创建空的Koalas DataFrame <pre><code>ValueError: can not infer schema from empty or null dataset

前端之家
2022-05-30 • 问答
火花考拉头vs显示速度差异

为什么将<code>df.show()</code>与<code>ks.DataFrame(df).head()</code>进行比较时会有速度差异？即使在转换为考拉之

前端之家
2022-05-24 • 问答
使用Koalas对空值求和

使用考拉时，有什么好方法可以汇总所有Null / NaN值的数据帧？或提出另一种方式我该如何按

前端之家
2022-05-23 • 问答
从大熊猫，考拉到CSV转换时，如何保留时区感知时间戳？

如何让考拉在时区感知的熊猫时间戳中保存时区信息？ <pre><code>>>> import pandas as pd >>> pds

前端之家
2022-05-20 • 问答
从数据砖中的大pyspark数据帧或考拉数据帧返回一行的最快方法是什么？

我在databricks笔记本上的考拉里有一个很大的数据框（2000万行，35列）。我已经使用python对它执行了一些

前端之家
2022-05-03 • 问答
这是什么意思？警告：root：'PYARROW_IGNORE_TIMEZONE' 环境变量未设置

我在 Jupyter Notebook 上使用 Python 工作，但收到此警告： <code> WARNING:root:'PYARROW_IGNORE_TIMEZONE' envi

前端之家
2022-05-03 • 问答
考拉sort_index增加spark分区

我是考拉的新手，当我使用 sort_index() 和 sort_values() 方法时，我很惊讶火花分区会自动增加。示例

前端之家
2022-05-02 • 问答
如何遍历考拉 groupby 的元素？

我想遍历数据框中的组。这在 Pandas 中是可能的，但是当我将它移植到 koalas 时，我收到一个错误。 <p

前端之家
2022-04-30 • 问答
databricks.koalas 的十分位数没有属性“qcut”

我在 databricks 中使用考拉并尝试对数据进行十等分。所以我用了 <code>df['Decile']= ks.qcut(d

前端之家
2022-04-29 • 问答
如何在 Koalas 中创建具有 2 个或更多条件验证的新列

我已经使用 3 次验证在 df3 上制作了“Turno”列以将其分类为“Turno_PM”、“Turno_AM”或“N/A”，但我想知

前端之家
2022-04-28 • 问答

首页

下一页
末页