-
使用HiveQL导入CSV文件
我的原始CSV数据中的某些行带有双引号,导致某些行的列位置。 我将如何解决此问题?我目前正 -
标记开始日期和结束日期的更改
我必须在Hive UI(SQL和Hive的混合)中编写代码, 以下是询问: <img src="https://i.stack.imgur.com/fU -
在SQL中提取数组的最后N个元素(配置单元)
我有一列包含数组,我想提取数组中的X个最后一个元素。 示例尝试提取最后两个元素: <pre><c -
我们如何在Hadoop中截断空格后的文本?
我有一栏说<code>column_1</code>,其值为: <pre><code>abc 12edf hbnm 847 47sf hg41 </code></pre> 我需要如下输出 -
蜂巢查询|在DML中使用分组依据
我创建了一个Hive表,如下所示: <pre><code>create table db.tab_temp as select col1,col2,col3 from db.tab; </code></pre> -
无法在Hive中使用分区创建实例化视图
我正在使用以下Apache Hive(版本3.1.0.3.1.0.0-78)和Hive JDBC(版本3.1.0.3.1.0.0-78)。我可以成功创建不带分区 -
在一个特定的列中,我想处理管道函数以及同时使用concat函数。我该如何实现?在下面查询
<pre><code>select regexp_replace(id,'["\t\n|]', '') as CONCAT('SF_',id) as id ,lastmodifiedbyid ,las -
如何使蜂巢返回行更快? (例如,限制10)
我注意到,当涉及到MR时,即使对于简单的查询,例如: <pre><code>select * from table where condition_a and cond -
蜂巢:降低时间戳的毫秒精度
在Hive中,是否有降低毫秒精度(<strong>不舍入</strong>)的方法? 例如,我有以下时间戳,毫秒数 -
Hive删除记录数
我从CSV创建了一个配置单元表 <pre class="lang-sql prettyprint-override"><code>CREATE TABLE RECORD_CSV( completed_on str -
蜂巢中Presto的transform()函数的等效项
我似乎无法在Hive中找到与Presto的<a href="https://prestodb.io/docs/current/functions/array.html#transform" rel="nofollow norefe -
失败:ClassCastException原语。WritableConstantStringObjectInspector无法转换为原语。BooleanObjectInspector
在蜂巢查询中,我用第一种方法得到正确的输出,但是第二种语法失败,不确定我到底缺少什么,但这 -
它的SAS功能需要转换为配置单元查询
下面提到的SAS脚本需要转换为蜂巢,任何人都可以建议我,如何在sql中做到这一点。 <pre><code>ARRAY va -
sql regexp字符串以“ .0”结尾
我想判断一个正数字符串是否以“ .0”结尾,因此我编写了以下sql: <code>select '12310' REGEXP '^[0-9 -
蜂巢:如何从特定子分区中进行选择
例如,在配置单元中创建一个表。 <pre><code>CREATE TABLE t_data_daily( imp_date BIGINT, sp STRING, datax ST -
蜂巢提取中的序列号生成
我必须从配置单元表中提取数据,并且还需要为配置单元中的每个记录生成序列号。与多个表连接后, -
在配置单元中选择minValue及其行
我必须在2小时的滑动日期窗口中选择minValue及其对应的日期值。例如 <pre><code>Create table stock(time string -
如何找到在蜂巢中薪水最高的每个部门中排名前三的员工?
<pre><code>name, salary, department joe, 95000, Manager walter, 26500, HR Adam, 36520,Developer Sam, 38910, Developer Romie, 68457,Manager o -
配置单元将行转置为列
需要将列转置为行。 <a href="https://i.stack.imgur.com/nbBYC.png" rel="nofollow noreferrer">Input Data</a> 我有 -
在蜂巢中对sortby vs order by的澄清
我正在阅读下面的Hive手册,并对文档中解释的详细信息感到困惑 <a href="https://cwiki.apache.org/confluence/displa -
SQL查询/根据日期和ID计算值的等级
<blockquote> 对于每个日期和ID,我们必须按降序对值进行排名。 下面是输入表。 </blockqu -
尽管我在where子句中包含null,
我运行以下查询: <pre><code>create table c.hello as select a.*, b.timestamp, b.alert from nice a left join bye b on a.nu -
减去3个月到yyyymm月格式列Hive SQL
在HiveSql中,我有一个yearmonth [yyyymm]列,我需要从中减去3个月 例如:如果yearmonth是201912,则所需的记录 -
配置单元将多个映射值合并为一列
表格(输入数据) <pre><code>+--------+---------+ | col_id | col_val | +--------+---------+ | axc | col_x | | bdf | c -
如何基于Apache Hive中的密钥从JSON列表中提取JSON对象
我需要根据id字段值从下面的json列表中提取一个json并将键显示为列 <pre><code>[{"id":"123", -
配置单元压缩不会自动触发-HDP_2.6.5
我在蜂巢中创建了一个表以测试压缩, <pre><code>CREATE TABLE part_test(id int, name string, city string) PARTITIONED -
蜂巢中的ASCII对应字符替换重音或双音UTF-8字符
我必须<由HIVE中的ASCII对应字符<strong>替换</strong> <strong> UTF-8字符</strong>(加重或变音符号)</strong> < -
计算值之间的最大差异并记录两个值在HIVE中发生的时间
我试图找到任何24小时内最大的温度差异,并返回发生该差异所花费的时间。下面的代码成功地找到了任 -
为什么在蜂巢中进行分组时出现错误?
我正在蜂巢中执行以下命令: <pre><code>Select child.data_volume_gprs_dl + child.data_volume_gprs_ul as data_usage, -
Hive中的字符串到时间戳的转换
我有一列包含以下格式的字符串:- <pre><code>2019-11-30T18:21:43.4775456Z </code></pre> 如何将其转换为时间