-
无法对考拉数据框执行操作
<pre><code>import databricks.koalas as ks df = ks.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6]}) df.columns = [ -
使用RGB值调用koalas.hist()时如何更改颜色
我有一个考拉数据框。我想绘制一个直方图,但我想使用RGB元组(r,g,b)更改颜色。如何更改下面的 -
PySpark无法在Koalas DataFrame中计算列式标准差
我在PySpark中有一个Koalas DataFrame。我想计算列标准偏差。我已经尝试过: <pre><code>df2['x_std'] = df -
如何在考拉中将具有空值的数据帧转换为csv?
当我在<code>to_csv</code>中使用<code>koalas</code>将数据帧转换为CSV时,空值填充为<code>\"\"</code>,但我 -
使用分配在Koalas DataFrame中添加新列
我有一个Koalas DataFrame,我想通过使用两列进行计算来添加新列。我有一个单独的函数来执行计算,并为 -
无法在考拉中加载JSON文件,导致连接被拒绝错误
<strong>问题描述</strong> 我尝试使用<code>koalas</code>加载JSON文件,但是它抛出连接拒绝错误。 如果 -
使用Databricks连接器在PyCharm中导入考拉时出错(Python 3.7)
当我尝试从数据块导入考拉时,我看到以下错误。我正在使用pyspark v2.4.5,并且能够成功连接到我的Spark -
Koalas / pandas_wraps无法返回列表
我正在学习考拉,并尝试转换一些现有的熊猫代码。我们使用的一种常见模式是<code>column.map(lambda x: x...) -
考拉groupby-> Apply返回'无法插入“键”,已经存在”
我一直在努力解决这个问题,但仍无法解决,因此获得了当前数据框: <pre class="lang-py prettyprint-overri -
Databricks Koalas:使用for循环创建具有条件的新列,并根据旧列名动态命名新列
示例数据集: <pre><code>kdf = ks.DataFrame({"power_1": [50, 100, 150, 120, 18], "power_2": -
Databricks Koalas无法导入镶木地板文件
当从Azure数据湖将镶木地板文件导入数据砖时,我遇到了错误。 <a href="https://i.stack.imgur.com/r0frz.png" rel="no -
在考拉中填充数据时间戳中的缺失值?
我在考拉数据框中的日期时间列中缺少值, <pre><code>cleaned_Data['Valuation_Date'].head() (1) Spark Jobs Ou -
考拉applymap将所有数据移动到单个分区
我需要对Koalas DataFrame进行逐元素操作。我为此使用了考拉<a href="https://koalas.readthedocs.io/en/latest/reference/ap -
包含.iloc的代码不适用于Koalas数据框
<pre><code>student1 = ("Allan", "Anderson") student2 = ("Barry", "Byars") student = [student1, student2] pr -
如何安装Spark 2.4的考拉?
我想在pyspark上运行我的熊猫代码,但是为此我需要考拉。 如何在Spark 2.4上安装和使用考拉 -
Koalas Group通过>应用> Lambda>系列
我试图将一些代码从Pandas移植到Koalas,以利用Spark的分布式处理。我正在获取一个数据框并将其分组在A -
koalas列分配不支持ndarray类型
全部-我正在尝试向现有考拉数据框添加新列,但失败,并显示上述错误。我要分配的值是一个np数组。 -
填充和插值考拉数据框
是否可以像这样插入和填充Koalas数据框中的不同列? <pre><code>%%spark -s sparkenv2 kdf = ks.DataFrame({ ' -
熊猫resample('D')方法的Spark / Koalas实现
我有一个Spark数据框,需要填写。数据框的大小很大(> 1亿行)。如下所示,我可以使用熊猫实现我想要 -
如何将熊猫数据框转换为具有混合数据类型的考拉
我正在使用Azure Databricks将熊猫数据框转换为考拉数据框... <pre><code>kdf = ks.DataFrame(pdf) </code></pre> 这 -
如何创建空的考拉df
我正在尝试使用以下命令创建空的Koalas DataFrame <pre><code>ValueError: can not infer schema from empty or null dataset -
火花考拉头vs显示速度差异
为什么将<code>df.show()</code>与<code>ks.DataFrame(df).head()</code>进行比较时会有速度差异? 即使在转换为考拉之 -
使用Koalas对空值求和
使用考拉时,有什么好方法可以汇总所有Null / NaN值的数据帧? 或提出另一种方式 我该如何按 -
从大熊猫,考拉到CSV转换时,如何保留时区感知时间戳?
如何让考拉在时区感知的熊猫时间戳中保存时区信息? <pre><code>>>> import pandas as pd >>> pds -
从数据砖中的大pyspark数据帧或考拉数据帧返回一行的最快方法是什么?
我在databricks笔记本上的考拉里有一个很大的数据框(2000万行,35列)。我已经使用python对它执行了一些 -
这是什么意思 ?警告:root:'PYARROW_IGNORE_TIMEZONE' 环境变量未设置
我在 Jupyter Notebook 上使用 Python 工作,但收到此警告: <code> WARNING:root:'PYARROW_IGNORE_TIMEZONE' envi -
考拉sort_index增加spark分区
我是考拉的新手,当我使用 sort_index() 和 sort_values() 方法时,我很惊讶火花分区会自动增加。 示例 -
如何遍历考拉 groupby 的元素?
我想遍历数据框中的组。这在 Pandas 中是可能的,但是当我将它移植到 koalas 时,我收到一个错误。 <p -
databricks.koalas 的十分位数没有属性“qcut”
我在 databricks 中使用考拉并尝试对数据进行十等分。 所以我用了 <code>df['Decile']= ks.qcut(d -
如何在 Koalas 中创建具有 2 个或更多条件验证的新列
我已经使用 3 次验证在 df3 上制作了“Turno”列以将其分类为“Turno_PM”、“Turno_AM”或“N/A”,但我想知