-
TSocket读取0字节(代码THRIFTTRANSPORT):TTransportException('TSocket读取0字节',)
[在此处输入图片描述] [1]当我将HIVE集成到我的HUE中时,我报告了一个错误。 我尝试了很多天, -
如何从多个列中查找值计数
有人可以帮助我从样本数据下方提取性别计数 <a href="https://i.stack.imgur.com/goTAf.png" rel="nofollow norefer -
如何在带有delta目录的配置单元中创建分区和还原的外部表?
我通过合并许多文件在HIVE中创建了分区表和存储桶表。由于某些原因,该表无法从HIVE进行访问,尽管其 -
如何获取HADOOP配置单元中同一文件夹中所有表的表计数?如果在SAS服务器中?
我想获取HADOOP配置单元数据库中名为“ planning”的文件夹下所有表的表计数,但是我不知道这样做的方 -
创建Hive表时出现的问题
我正在尝试创建一个配置单元表并将SO中的一些帖子加载到该表中。当我查看该值时,我看到很多链接/ -
Power BI-直接查询具有数百万条记录的hadoop
我是Power BI的新手。我被要求为大型数据集(在Hadoop中)生成Power BI报告,然后将其发布到Power BI服务上 -
带有Glue + S3的基于Spark成本的优化器
我有在EMR群集上运行的Spark作业。 EMR使用AWS Glue作为Hive元存储。作业通过拼写格式通过EMRFS将数据写入S3 -
Hive-两个读者问题有解决方案吗?
在hive托管表中执行合并操作后,我们在HDP版本的Hive表(Hive 3.1.0.3.1.0.0-78)中面临以下问题。 当我 -
HIVE数据透视和计数
我有一张桌子,我试图找出如何根据这些数据进行旋转和计数。 这个例子可能不太合适,但是结果正是 -
找不到Apache Atlas列沿袭
我使用Hive2.1.1和Atlas2.0.0。 我可以找到表沿袭,但找不到列级沿袭 详细信息如下所示 -
如何在Haddop中查找用户正在运行的作业数?
我想知道在没有任何UI应用程序的情况下在Hadoop中运行的作业数量,实际上,我对表进行某种查询更感兴趣。 -
有没有一种方法可以给Hive中的表赋予“第二个名称”,以便用户可以引用该表的任何一个名称并检索相同的内容?
我希望能够引用具有特定命名模式的表以使我的代码统一,但是我正在从具有不同命名模式的不同环境 -
在Hive和Impala中使用不同的分隔符创建表
在Hive和Impala中的表格方面,我需要您的帮助。我的问题是我必须 插入以下数据: <pre><code> HD_4K; -
配置单元表在每个日期加载前重新创建
我看到应用程序正在删除外部表并再次创建,然后每次加载数据时都加载数据并运行msck命令。每次删除 -
Hive时间戳格式?
配置单元支持任何特定的时间戳格式吗? 我的spark作业有一个时间戳“ yyyy-MM-dd-HH-mm-ss”,但是在 -
将多个按组查询合并为一个查询
我有一个结构类似于下表的表,我有四个分组变量(Region,Site,Method,Client)和三个指标,每个指标都 -
怎么把“ 2019-11-02T20:18:00Z”转换成HQL中的时间戳?
我有日期时间字符串<code>"2019-11-02T20:18:00Z"</code>。如何在Hive HQL中将其转换为时间戳? -
镶木地板数据类型问题中具有Alluxio存储的Hive Metastore
我正在将prestodb与hive metastore一起用于架构存储,并将alluxio缓存用作数据的外部存储。在alluxio和hive模式 -
是否有SQL命令删除HDFS上用于外部表的文件
我会问蜂巢中是否有sql命令删除该表并删除此外部表的hdfs文件。 当我使用hdfs命令删除文件时,我 -
在具有OR条件的2个表之间进行SQL连接
我只是想了解连接两个具有OR条件的表的概念。 我的要求是:我需要在Table1.colA = Table2.colB列上联接2个表 -
行号为CASE WHEN的ORDER BY
我的数据如下所示 <pre><code>+---------+-----------------+-----------+ | user_id | purchase_bucket | Frequency | +---------+- -
连接多个表以仅返回主表中每个记录的一个结果
目前我要加入三个表。我有从一个系统(旧)迁移到另一个系统(新)的数据。我需要比较此数据,以 -
?+。+在HiveQL中的select语句中的作用
我有一些要理解的HQL代码。 下面是代码。 <pre><code>v=log(p(r))</code></pre> 有人可以解释这是如何工作 -
分流流配置单元表以在本地执行计算并追加到远程服务器上的另一个表
我必须使用Libpostal在远程服务器上的Hive表上执行计算。不幸的是,我无法在此服务器上安装libpostal(及 -
配置单元仅插入事务表
使用仅配置单元插入的交易表有哪些特殊好处?大多数文档仅表明如果您不需要删除或更改功能,请创 -
配置单元加入分区
我有这两个表: <pre><code>table products ( product_id bigint, product_name string ) partitioned by (product_category as stri -
数据集中的拆分数量超过数据集拆分限制,Dremio + Hive + Spark
我们有一个由Hadoop + Hive + Spark + Dremio组成的堆栈,因为Spark为单个Hive分区写入多个HDFS文件(取决于工作 -
Apache Hive无法正确返回YARN应用程序结果
我正在AWS EC2上运行从头开始的集群。我有一个用S3上的数据定义的外部表(已分区)。我可以查询此表 -
查找每月重复的用户
我下面有这样的数据 第一个月的交易 <pre><code>User_id trsaction_completed_date user_type -
同一分区列在输出目录中显示两次
我遇到一个问题,同一个分区列在输出目录中每次显示两次,例如<code>s3://myPath/transits/marketplace_id=1/hit_da