-
spark-sql_2.11-2.4.0-cdh6.2.1.jar
Spark Submit命令(请参阅最后的示例命令)正在使用spark-sql_2.11-2.4.0-cdh6.2.0.jar,但是当我将版本升级到spar -
为什么hbase shell中的命令whoami无法获取组信息?
我有一个<code>cdh hadoop cluster</code>,它为<code>authentication</code>和<code>authourization</code>使用活动目录。当我 -
使用cloudera CDH5.13运行简单的pyspark代码时出错
我正在运行以下简单代码。实际上,我刚刚开始使用cloudera cdh练习spark。我的目标是读取“订单”表,然 -
色相服务错误:无法连接到quickstart.cloudera:21050
我已经在虚拟盒子中安装了cloudera-quickstart-vm-5.13.0-0-virtualbox。 配置详细信息: CPU:3和内存 -
Maven软件包cdh5.x时,远程主机关闭了连接
我使用java jdk1.7.0_80和maven 3.0.5将cdh5.6.0 hadoop构建为Apache 2.6.0。 这是我的命令: <pre><code>mvn package -Dm -
具有复杂数据结构的配置单元列,在读取实木复合地板数据后给出空值
读取实木复合地板数据作为数据帧后,如下图所示: <a href="https://i.stack.imgur.com/r0P3r.png" rel="nofollo -
Spark Streaming-DStream的匿名函数阻止java.lang.ClassNotFoundException错误
我正在尝试将我的Spark Streaming应用程序部署到CDH6.3.2。 但是<strong> DStream的匿名功能</strong>(例如foreachRDD -
资源分配已接受纱线申请但未运行cloudera
我正在使用Cloudera quickstart VM 5.13.0.0在yarn-client模式下运行Spark应用程序。我已经为Cloudera VM分配了10GB和3 -
Spark的哨兵特权
我对Hadoop集群上Sentry的Spark特权有疑问。 首先,了解一些背景- <ol> <li>我正在使用CDH版本5.13.2 < -
Sentry ptivilege用于Hadoop中的alter table
我拥有Hadoop上所有授予数据库的用户。 我在用户尝试更改同一数据库中的表时收到错误消息。 该错误表 -
Cloudera Metric模板位置或创建自定义
我正在尝试创建自定义指标模板以反映在图表构建器上。另外,我需要知道配置文件,可以在其中更改 -
如何在Hive中使用子查询
我可以在MySQL中的subquery命令下面运行,但是在Hive中不起作用。 Hive格式对于MySQL的子查询是否有所不同 -
UDF Impala libstdc ++。so.6
我正在创建udf,然后遇到下一个问题。你能帮我吗? 错误:AnalysisException:无法加载二进制文件: -
Cloudera Manager代理引起的HDFS NameNode JvmPauseMonitor警告
在我们的在线集群中,我们收到许多这样的警告: <pre><code>2020-01-21 09:08:00,711 INFO org.apache.hadoop.util.Jv -
Hive升级的可能性
是否可以仅对我的CDH-5.13.3进行升级? Hive的两个版本可以在群集上共存吗? 我想要Hive-3作为ACID属性。 -
如何在Cloudera分发中获取群集总空间配额
如何在Cloudera分发中获取群集总空间配额。这里要说明的一点是,某些现有目录未设置空间配额。 -
无法将数据加载到配置单元表中
在CDH 5.13中,我使用Hive Shell创建内部表。但是,当我尝试将数据加载到其中时,出现以下错误: <pre> -
Docker上的Cloudera Manager无法正常工作
我在Ubuntu 18.04LTS的docker上使用cloudera quickstart vm。当我使用运行命令启动vm时: <pre><code>sudo docker run -- -
在Cloudera中创建的视图(Cloudera SCM服务未重新启动)
我已经创建了用于获取数据库大小的视图,但是在重启Cloudera SCM服务之后,它将无法成功重启。我们可 -
dfs.blocksize和BlockCapacity的值不同
NameNode的REST响应中给出的BlockCapacity与我们在HDFS <code>dfs.blocksize</code>下的Ambari中设置的不同。 使 -
如何设置Hadoop集群的双向身份验证?
我想使用Java代码访问诸如http://:50070 / jmx,http://:8088 / jmx之类的Hadoop REST API,并希望在代码中为这 -
来自本地机器的Cloudera Spark连接
<pre><code>from pyspark.sql import SparkSession from pyspark.sql.types import * from pyspark.sql.functions import * sparkdriver=SparkSessio -
Impala写入hdfs文件挂起问题
我使用带impala外壳的oozie进行数据ETL。 (impala查询-插入覆盖) 但是,我发现工作流的运行时间比 -
Presto-Hive Connector的游侠问题
我们有一个Presto(Version-323-E.8)连接器,具有启用了Ranger的CDP Hive3集群,在这里我可以在现有的Hive ORC格 -
在光碟化的CDH集群中运行kudu fsck
我正在尝试让cloudera管理器对kudu集群进行检查,最终将以kudu用户身份运行以下命令: <code>kudu clus -
从kudu磁盘迁移数据
<strong>问题(TL; DR;)</strong> 我正在寻找一种告诉kudu从目录(在下面的上下文中为<code>/data/0</code> -
如何找出CDH kerburised群集中特定kafka主题的最大偏移值
我有一个使用Kerberos的41个节点的CDH群集,其中28个已安装Kafka。 我想找出特定Kafka主题的最大偏移 -
获取ClassNotFoundException连接到cassandra时找不到数据源(写)
我在cloudera集群中并行运行数百个spark作业,全天写入Cassandra集群。每天,当在多租户环境中对群集施加 -
有没有办法在集群中克隆服务配置?
我需要将服务配置(色相,火花等)从一个群集克隆到另一个群集。这两个集群都由Cloudera Manager管理( -
默认字段如何影响SOLR性能?
在Cloudera CDH 5.10上使用[SOLR 4.10] 我有以下使用默认字段的solr查询,但也在q中明确设置了它:<