-
无法在Cloudera Quickstart Docker上启动Cloudera服务
我正在尝试在Cloudera的quickstart docker映像(5.13.0)上启动cloudera服务。 我从Cloudera网站下载了该图像 -
缺少文档Cloudera
我对HDFS中的cloudera复制计划有疑问。我正在尝试获取HDFS中复制计划的计划ID,但是缺少其中一个参数的 -
尝试从Spark查询HBase上的数据时出现NoSuchMethodError
我正在尝试使用SparkSQL / DataFrames查询加载到HBase表中的数据。我的集群基于Cloudera CDH 6.2.0(Spark版本2.4.0 -
spark-sql_2.11-2.4.0-cdh6.2.1.jar
Spark Submit命令(请参阅最后的示例命令)正在使用spark-sql_2.11-2.4.0-cdh6.2.0.jar,但是当我将版本升级到spar -
Impala不支持Unicode字符
Select语句在Impala上返回错误字符。<a href="https://i.stack.imgur.com/1Su96.jpg" rel="nofollow noreferrer"><img src="https://i -
在Cloudera Quickstart VM上配置哨兵安全性时出现NPE异常
我已经安装了Cloudera的快速入门VMBox,尝试测试将Hive与Sentry集成在一起的安全方式。但是,当我在Sentry服 -
在Cloudera中的hadoop字数示例中获取数字
下面我们使用了以下代码: 映射类是WCMapper。 reduce类是WCReducer。 不太清楚为什么输出会生成数字 -
打包不包含cloudera包裹的Pyspark应用程序
我习惯于在虚拟环境和requirements.txt文件中“传统”包装Python。随着诸如pipenv之类的工具的出现,这些模 -
SQL:给定日期可用的最大日期
我想计算<code>cash_date</code>列的最大日期,如果为空,则应填充可用的最新日期。 SQL脚本: <pr -
Sqoop失败,并带有密码文件参数
我有一个sqoop脚本,可将数据从SAP HANA提取到Hive。当我将密码作为参数“ --password Password $$”输入时,sqoo -
如何在Cloudera中建立Grafana和Hive连接
我正在尝试连接Grafana并根据Hive表中存在的数据创建仪表板。 不确定是否可行,因此寻求SO社区的帮助。 -
色相服务错误:无法连接到quickstart.cloudera:21050
我已经在虚拟盒子中安装了cloudera-quickstart-vm-5.13.0-0-virtualbox。 配置详细信息: CPU:3和内存 -
每次重新启动时都会替换Cloudera节点/etc/krb5.conf
我有一个问题,为什么我的cloudera节点每次重新启动都替换文件/etc/krb5.conf?我试图进行修改,并且当有 -
无法下载适用于Cloudera的Talend Open Studio for Big Data
我想在Cloudera中下载Talend for Big-Data,但是官方网站www.talend.com/download中只有Windows + MACOS版本。 有人可以 -
impala创建外部表并删除双引号
例如,我获得了CSV上的数据: “女性”,“ 44”,“ 0”,“ 0”,“是”,“政府工作”,“城市”, -
无法使用$符号读取Scala中的环境变量
在Scala环境属性中添加属性<br/> <pre><code>val sysProps = System.getProperties sysProps.setProperty("current.date.time -
如何在Pred hadoop群集上使用s3文件?
我有一个cloudera VM并能够设置AWS CLI和设置密钥。但是,我无法使用<strong> hadoop fs -ls s3:// gft-ri或s3文件 -
SSIS未将数据写入Cloudera表
我们正尝试使用“ SSIS:执行sql进程”将数据插入表中。该过程已成功执行,但有时不会将数据插入表中 -
Cloudera“构建情感分析应用程序”问题
我一直在尝试查看关于<a href="https://www.cloudera.com/tutorials/building-a-sentiment-analysis-application.html" rel="nofollow n -
twitter4j.TwitterStreamImpl:连接重置
我正在cloudera中使用水槽将Twitter数据提取到hdfs,但是它无法连接到Twitter API,它一直在尝试,但毕竟失 -
Cloudera升级到5.16.1后,Spark Job失败
我有一个非常简单的示例Spark作业,其中包含Spark 1.6编译的2 + 2。 我正在通过以下方式执行spark提 -
Hortonworks docker沙箱未在浏览器中加载
我已经按照同伴的指示安装了HortonWorks Docker沙箱。 当我键入以下内容时,它似乎正在运行: < -
SQLAlchemy Cloudera impala至Superset连接网址
我正在尝试将数据从cloudera impala发送到超集。我正在编写impala:// IP:21050 / default,但出现此错误。 -
从CDH Hadoop集群连接到S3的“ peer not authenticated”异常
我正在尝试在Hadoop CDH群集上运行hadoop作业,并且当Hadoop作业尝试从S3存储桶读取数据时出现错误。看起 -
使用Kerberos身份验证将我的Hive与R连接?
我正在尝试将Hive与python和R连接,将蜂巢与python成功连接,但未与R连接成功,首先让我告诉我如何使用py -
如何为Kafka和Zookeeper设置JAVA_HOME Cloudera快速入门
我已将Kafka服务添加到我的Cloudera集群中,当我尝试启动它时,它失败并显示以下错误 <pre><code>Exceptio -
Apache Zookeeper无法启动,它不断循环循环显示错误信息'拒绝对客户端zxid 0x1d34的请求,我们最后一个zxid为0x0
我正在关注本教程:<a href="https://kafka.apache.org/23/documentation/streams/quickstart" rel="nofollow noreferrer">https://kafka -
无法在Cloudera Hue的表详细信息中加载标签
我正在使用Hue访问Cloudera Impala。打开表浏览器并查看任意表的详细信息时,出现错误“无法加载标签” -
如何使用hdfs fsck命令识别损坏的文件?
我想检查hdfs中损坏的块 使用以下命令 <pre><code>hdfs fsck /myfile.txt -files -blocks -locations </code></pre> -
资源分配已接受纱线申请但未运行cloudera
我正在使用Cloudera quickstart VM 5.13.0.0在yarn-client模式下运行Spark应用程序。我已经为Cloudera VM分配了10GB和3