-
创建具有Serde格式和额外列的外部表-HIVE
我正在尝试将txt文件导入到外部表中,并在蜂巢中添加一个额外的列,例如: <pre><code> CREATE EXTERNAL T -
如何在sqoop中限制映射器数据?
我正在尝试使用Sqoop导入将5M记录从SQL Server导入到Hive表中。 <strong>源表:</strong> 源表只是 -
将base64转换为可读的字符串
我在SQL Server 2016中有一个具有nvarchar列的表,我想将其存储在配置单元中。 nvarchar列可以包含非ASCII字符 -
如何从Hive中的元数据(Varchar)中提取数据?
<pre><code>{"payment_charge_type":null,"ota_card_charge_attempt":false,"card_details":{"entity_type_card_chargin -
将数据导入到配置单元表后,NULL和实际数据一起加载
我正在从csv文件加载,并且数据之间用空格隔开。将数据加载到最终表中后,它将加载额外的NULL,这是 -
基于SQL Standard的Hive授权中对Hive表的管理员访问
我想授予管理员访问角色的权限,该角色必须对hive表具有所有访问权限。例如更改,删除,插入,更新 -
.dat文件到配置单元表中,数据用双引号引起来
我有一个文件.dat文件,如下所示,该文件要加载到hdfs位置,然后再加载到表中。这是由软件生成的 -
Impala不支持Unicode字符
Select语句在Impala上返回错误字符。<a href="https://i.stack.imgur.com/1Su96.jpg" rel="nofollow noreferrer"><img src="https://i -
HiveQL是否有任何源代码分析/质量工具?
我在Google上搜索了很多内容以获取HiveQL的源代码分析器,但没有找到任何此类工具。 我已经检查 -
有关表的分区键的不同查询
如果我要查询的是表的某列上的不重复数据,该列是该表的分区键,它将扫描这些分区内的整个数据, -
将行转置为Hive表上的列
我遇到一种情况,我需要联接多个表(table1,table2,table3)并拉一些字段,例如 <ol> <li> 计数(表2 -
将日期时间dttm转换为SparklyR中的日期
我正在尝试从Hive数据库获取正确的日期。当我提取日期时,我得到的是原始日期的前一个日期。 -
Impala / Hive查询多个联接条件
我需要对来自tableA_index的结果进行分组,然后将其与tableB合并以获得以下结果。 <ul> <li> tableA_index -
Hive SQL聚合将多个SQL合并为一个 说明:
我有一个类似的串行sqls: <pre><code>select count(distinct userId) from table where hour >= 0 and hour <= 0; select c -
为什么此Hive代码返回0个结果?
<pre><code>select * FROM prd_raw_sf.sf_opportunity_dn A JOIN prd_raw_sf.sf_opportunity_rw B ON A.OPPORTUNITYID = B.SFDC_ID LEFT -
无法启动HIVE
配置单元版本-3.1.2 Hadoop版本-2.7.1 Java版本-openjdk 11.0.5-ea 2019-10-15 注意:我已经在HDF -
蜂巢:当列值由定界符(〜)分隔时,将单个记录扩展为多个记录
我有以下信息 <pre><code>id user date test 102 123~456~897 01JAN2019~6JUL2018 -
发行后的Hive案例
以下是Hive中的代码失败: <blockquote> (无法识别6:5(结束)的别名) </blockquote> <pre><code>IN -
如何将逗号分隔的数组转换为Hive中的行
我尝试获取表中每个transactionid的anchorurl摘要,因此需要将逗号分隔的数组转换为行。 这是在Hive中 -
可以在近RDBMS场景中使用哪些hadoop框架
我们正处于一个项目的分析阶段,在该项目中,我们将替换基于hdfs和用于报告和查看的配置单元的旧存 -
在Hive中创建表,但不确定输入应使用哪种数据类型
我是HIVE的新手,正在尝试在蜂巢中创建表。但不确定在下面的输入中应使用哪种数据类型。 <a hre -
在Cloudera Quickstart VM上配置哨兵安全性时出现NPE异常
我已经安装了Cloudera的快速入门VMBox,尝试测试将Hive与Sentry集成在一起的安全方式。但是,当我在Sentry服 -
游侠-Hive服务设置
我正在尝试设置用于配置单元授权的Ranger服务,但与创建配置单元服务时需要使用的细节混淆了。 <p -
从Beeline连接时,Hive查询在Tez上失败,但在Map-Reduce上成功
我遇到一个奇怪的错误。我正在运行带有where子句的简单select *查询,以下是查询执行状态的摘要 <ol> -
为什么在写入Hive表期间更改了Spark数据帧中的时间戳列?
我试图使用JDBC读取Oracle表并将数据插入到Hive表中,但是所有timestamp列的值均已更改(-6小时)。为什么 -
Hive-Tez UDF-如何获取python stacktrace?
我正在运行带有<code>transform() using</code>子句和python脚本的Hive-on-Tez(Hortonworks HDP-3.1)查询。当我的脚本 -
雅典娜(Athena)中的JSON数组读取不正确,无法取消嵌套
我有一个名为<code>uf</code>的列,其中包含JSON对象数组。这是一个样机: <pre><code>[ {"type":  -
如何连接SQL中乱序的字符串碎片消息
我有一个包含三列的表,第一列表示一条消息ID(message_id),第二列代表一个序数特征,该顺序特征表 -
Hive中的“冷启动”是什么,为什么Impala不会因此遭受痛苦?
我正在阅读有关比较Hive和Impala的文献。 一些消息来源声明了以下“冷启动”行的某些版本: -
使用Flume
我有一个使用套接字通过netcat发送数据的python脚本 <pre><code>import socket import time import csv import json clien