-
当此字段恰好等于'A'时,像'%A%'语句和in('A')语句之间有什么区别吗?
我认为,如果此字段包含多个字符,那么<code>in ('something')</code>比<code>like '%something%'</code>快 -
创建Hive表时出现的问题
我正在尝试创建一个配置单元表并将SO中的一些帖子加载到该表中。当我查看该值时,我看到很多链接/ -
有没有一种方法可以给Hive中的表赋予“第二个名称”,以便用户可以引用该表的任何一个名称并检索相同的内容?
我希望能够引用具有特定命名模式的表以使我的代码统一,但是我正在从具有不同命名模式的不同环境 -
将多个按组查询合并为一个查询
我有一个结构类似于下表的表,我有四个分组变量(Region,Site,Method,Client)和三个指标,每个指标都 -
怎么把“ 2019-11-02T20:18:00Z”转换成HQL中的时间戳?
我有日期时间字符串<code>"2019-11-02T20:18:00Z"</code>。如何在Hive HQL中将其转换为时间戳? -
在具有OR条件的2个表之间进行SQL连接
我只是想了解连接两个具有OR条件的表的概念。 我的要求是:我需要在Table1.colA = Table2.colB列上联接2个表 -
行号为CASE WHEN的ORDER BY
我的数据如下所示 <pre><code>+---------+-----------------+-----------+ | user_id | purchase_bucket | Frequency | +---------+- -
如何从字段中的值中删除-python或pyspark
我有一个看起来像的字段 <pre><code>field1 231-206-2222 231-206-2344 231-206-1111 231-206-1111 </code></pre> 我尝试 -
?+。+在HiveQL中的select语句中的作用
我有一些要理解的HQL代码。 下面是代码。 <pre><code>v=log(p(r))</code></pre> 有人可以解释这是如何工作 -
查找每月重复的用户
我下面有这样的数据 第一个月的交易 <pre><code>User_id trsaction_completed_date user_type -
将base64转换为可读的字符串
我在SQL Server 2016中有一个具有nvarchar列的表,我想将其存储在配置单元中。 nvarchar列可以包含非ASCII字符 -
HiveQL是否有任何源代码分析/质量工具?
我在Google上搜索了很多内容以获取HiveQL的源代码分析器,但没有找到任何此类工具。 我已经检查 -
Hive SQL聚合将多个SQL合并为一个 说明:
我有一个类似的串行sqls: <pre><code>select count(distinct userId) from table where hour >= 0 and hour <= 0; select c -
无法在pyspark中导入parse_url 编辑:
我有这个sql查询,用于pyspark中的hiveql: <pre class="lang-py prettyprint-override"><code>spark.sql('SELECT split(par -
为什么此Hive代码返回0个结果?
<pre><code>select * FROM prd_raw_sf.sf_opportunity_dn A JOIN prd_raw_sf.sf_opportunity_rw B ON A.OPPORTUNITYID = B.SFDC_ID LEFT -
蜂巢:当列值由定界符(〜)分隔时,将单个记录扩展为多个记录
我有以下信息 <pre><code>id user date test 102 123~456~897 01JAN2019~6JUL2018 -
发行后的Hive案例
以下是Hive中的代码失败: <blockquote> (无法识别6:5(结束)的别名) </blockquote> <pre><code>IN -
如何连接SQL中乱序的字符串碎片消息
我有一个包含三列的表,第一列表示一条消息ID(message_id),第二列代表一个序数特征,该顺序特征表 -
在Hive中插入覆盖表时,从org.apache.hadoop.hive.ql.exec.StatsTask错误返回代码1
我在Hive表上执行插入覆盖(合并文件本身时)时出现以下错误。 <strong>错误</strong>:<code>return co -
如何从多个列中计数记录以消除配置单元表中的空值
我正在使用以下命令从8列中查找记录的总和,但在O / P中却变为空,如下所示。 <a href="https://i.sta -
在hadoop的同一分区中合并多个文件的最佳选择?
我有一个按event_date分区的表,由于某种原因,当我将数据插入到外部表中时,有些日期只有一个或两个 -
带有where子句的问题,该子句从当前日期起回溯24个月
我有这个where子句,在Impala中工作正常,但在Hive中抛出错误。我想做的只是在当天的24个月前输入数据。 -
在Hive中加入SCD Type 2表的性能
我在Hive中有2个表,这些表使用SCD Type 2(<a href="https://en.wikipedia.org/wiki/Slowly_changing_dimension#Type_2:_add_new_ro -
在会话期间何时设置配置单元参数?
我是我的新手,部分工作需要在托管和外部配置单元表中创建/插入数据。我们在配置单元会话开始时运 -
如果满足任一条件,我想提取数据。目前看来,只有同时满足两个条件,才可以提取数据
如果满足任一条件,我想提取数据。目前,似乎只有同时满足两个条件,才能提取数据。 <pre><code>sel -
蜂巢-是否可以从地图创建列
我正在寻求一些建议,以了解将蜂巢中的Map转换为列(转置)的可能性 下面给出了一些示例记录以及我 -
在计算Hive中的百分位数时处理Null
在计算百分位数时,在处理null时遇到一些麻烦。以下是示例数据。 <a href="https://i.stack.imgur.com/vUv -
使用正则表达式处理配置单元中的特殊字符
我有这样的数据。 <pre><code> +--------------+--------------+-------------+------------+----------+--------------+---------- -
配置单元查询中反引号`符号的用法
以下Hive查询(Hive版本1.2.1000.2.6.5.1100-53)中出现错误。 SELECT * from`dbname.table_name`,其中columnname =' -
蜂巢倾斜加入问题 第一季度:第二季度
我对蜂巢中的倾斜连接有一些疑问。 1.when何时将使用通用联接来处理数据,因为我仅在设置打击