-
如何在火花编码器中映射Cassandra日期类型?
我正在尝试在cassandra表上实现简单的聚合。但无法在Spark中映射cassandra日期类型。尝试映射<code>String</code -
如何使用Spark Cassandra连接器存储结构类型
我具有以下JSON结构,其中包含员工详细信息及其地址- <pre><code>[ {"id" : 1000, "name" : "dev -
Spark批处理可在2个Cassandra群集之间迁移数据
我正在使用spark将一些数据从一个cassandra表移动到另一个集群上的另一个cassandra表。 我为以下源集 -
Cassandra维护一个处理列?非酸行为没有破坏,但应该有解决的办法吗?
我在测试环境中运行着Spark 2.4.3和Cassandra 3.11.4的工作集群。 现在,我有一列带有整数的列,该整 -
从Spark写入Cassandra
我正在使用spark-cassandra-connector-2.4.0-s_2.11将数据从spark写入Databricks集群上的Cassandra。 我在将数据从 -
有没有办法找出Cassandra中的SELECT语句使用了哪个节点?
我已经为<code>spark-cassandra-connector</code>编写了一个自定义LoadBalancerPolicy,现在我想确保它确实有效! -
无法使用spark-cassandra-connector:java.lang.NoClassDefFoundError:org / apache / commons / configuration / ConfigurationException
我有带有Spark 2.3.2和Cassandra 3.11的Hortonworks HDP 3.1。 Spark运行正常。 然后,我正在遵循Cassandra <a href= -
分组Cassandra行,然后使用Spark写为实木复合地板文件
我需要将Cassandra分区写为实木复合地板文件。由于我无法在foreach函数中共享和使用sparkSession。首先,我 -
spark-cassandra-connector配置:current.reads与input.reads_per_sec
阅读<a href="https://github.com/datastax/spark-cassandra-connector/blob/master/doc/reference.md#read-tuning-parameters" rel="nofollow n -
spark-cassandra-connect python deleteFromCassandra方法
我正在Databricks Notebook上使用Spark,Cassandra,Spark-Cassandra-Connector,根据他们的网站,我们可以使用'deleteFro -
spark-cassandra-connector scala更新列
我有这样的桌子: <pre><code>+----------------+--------------+------+-----------------------+-----------------------+ |cid -
Databricks Spark Cassandra连接引发异常:com.datastax.driver.core.exceptions.NoHostAvailableException
我已经在Azure虚拟机中安装了Cassandra数据库,并希望通过Azure Databricks执行读/写操作。我正在经历Databricks -
如何使用python从gcloud集群连接Cassandra
我们尝试使用Jupyter笔记本电脑使用bash脚本连接集群: <pre><code>!gcloud compute --project "project_name" -
此消息的含义StorageProxy.java:2358-Cassandra debug.log
这些消息不断进入Cassandra debug.logs是什么意思。 这些消息对集群健康有好处还是有害? DEBUG [pool-1 -
在Cassandra中迁移数据的最佳方法是什么
我有一个包含<code>var offset=250; //You can set offset accordingly based on your UI function AdjustPopup() { $(".modal-bod -
Spark Cassandra连接器:实现SCD类型1
我是Cassandra的新手,我想在Cassandra DB中实现<strong> SCD Type-1 </strong>。<br/> 此SCD Type1作业将在Spark中执行。< -
Cassandra + Spark执行器超融合
由于Apache Spark是建议用于Cassandra的分布式处理引擎,因此我知道可以与Cassandra节点一起运行Spark执行程序 -
类文件中的常量池数据不一致
我正在尝试使用spark cassandra连接器从表中获取值。 load()产生IncompatibleClassChangeError。我的开发环境定 -
Spark RDD与Cassandra Table一起加入
我正在将<code>Spark RDD</code>与<code>Cassandra table</code>(查找)一起加入,但无法理解一些事情。 <ol> <li> -
如何使用Pyspark将表格格式数据转换为句子或可读格式?
<a href="https://i.stack.imgur.com/4KnSu.png" rel="nofollow noreferrer">Here is the table format in image so how should i convert it int -
spark-cassandra-connector,将重试尝试限制到死的cassandra节点
@here:我们在kuberenetes中运行cassandra,并使用spark-cassandra连接器,我们面临的问题是kubernetes POD重新启动 -
将spark连接到cassandra,java.lang.IllegalArgumentException:帧长应为正
使用spark 2.4.4连接cassandra时收到此错误消息 <ul> <li>用于连接cassandra的命令</li> </ul> <pre><code>spark-submit -
无法将Spark Dataframe写入cassandra表
我正在用Cassandra连接HDP3.0上的spark,以将数据帧写入cassandra表中,但收到以下错误: <a href="https://i.stack.i -
如何每几行加载csv几行
我将Spark连接到Cassandra,并且能够使用常规的COPY方法打印CSV的行。但是,如果CSV很大(通常在大数据中 -
Spark:如何在保存到cassandra的同时配置写入时间
我有一个类似于cassandra表的实体。我正在使用spark将数据保存/更新到Cassandra中。这里的实体是<strong>要约 -
获取ClassNotFoundException连接到cassandra时找不到数据源(写)
我在cloudera集群中并行运行数百个spark作业,全天写入Cassandra集群。每天,当在多租户环境中对群集施加 -
使用pyspark将数据从pyspark数据帧插入到另一个cassandra表中
我有一个<strong> cassandra </strong>表-<strong>测试</strong>: <pre><code>+----+---------+---------+ | id | country | counte -
Oracle与Cassandra数据比较
oracle中的表具有一列,该列的json字符串中包含值,需要在cassandra中验证与json中的列值相同的表。但是 -
如何将pyspark-cassandra添加到Pycharm
嗨,我正在为Sparkpackages奋斗。我在Pycharm中使用pyspark,我添加了引用并且工作正常。使用这些包时,我 -
将Spark数据集[(String,Map [String,String])]插入Cassandra表
我有一个类型为Dataset [(String,Map [String,String])]的Spark数据集。 我必须将其插入Cassandra表中。</