data-partitioning

使用虚拟列的Oracle自动LIST分区不允许子表上的REFERENCE分区

我尝试使用虚拟列在测试表上创建分区。这种方法对PARENT或独立表都有效。但是，如果使用虚拟列对PAREN

前端之家
2022-08-15 • 问答
作为哈希子分区的一部分，如何为键指定多个列？

我正在创建一个包含复合分区的表（<code>RANGE</code>，然后是<code>HASH</code>）我的实际表很大，所以

前端之家
2022-08-15 • 问答
何时在RANGE INTERVAL分区中创建本地和全局索引

我们正在利用Oracle 12c RANGE INTERVAL分区，在该分区中Oracle根据数据自动创建分区。父表基于RANGE INTE

前端之家
2022-08-14 • 问答
在机器学习中多次具有相同的输入（具有不同的输出）是否可以接受？

我想知道在机器学习中是否可以包含一个可能多次包含相同输入但每次包含另一个（有效！）输出

前端之家
2022-08-14 • 问答
如何为每个分区（最多包含5个时间依赖成员）创建平均值？

我的目标是仅在符合其他表的左联接条件的情况下，平均选择恰好 5条记录。假设我们有<st

前端之家
2022-08-14 • 问答
窗口，按HIVE划分以获取平均7天温度

我有一个数据集，每天有多个温度读数。我希望按平均温度返回最热的7天时段。 <pre><code>DROP TABLE IF

前端之家
2022-08-11 • 问答
在Powershell中切片数组（或列表）的更好方法 Select-Chunk源代码：

我如何导出CSV文件中的邮件地址（每个用户30位用户）。我已经尝试过了 <pre class="lang-b

前端之家
2022-08-10 • 问答
高效的相关数据分区以实现并行化

我有一些数据，这些数据具有许多间隔，这些间隔由唯一的ID（字符串）以及开始和结束坐标（整数）组

前端之家
2022-08-02 • 问答
BigQuery：日期和_table_suffix的加入速度非常慢

在查询中，我希望从分区表中获取数据，其中每个用户根据用户特定的日期需要一个不同的分区。这需

前端之家
2022-07-24 • 问答
检查X次失败/通过？

我一直想在Prolog中解决一个快速问题。有什么方法可以检查谓词中至少X个失败（或通过）？例如

前端之家
2022-07-18 • 问答
使用分区将pyspark数据帧写入s3位置

我有一个370万个相对较小的数据框，其中有一个日期列（到01-01-2018为止）和一个合作伙伴列以及其他唯

前端之家
2022-07-13 • 问答
如何在wixData-aggregate上创建分区以查找最后一个值

我正在尝试查找特定用户的最新消息和最新更新时间我的收藏结构： <pre><code>**User_id update

前端之家
2022-07-13 • 问答
C ++使用<algorithm>对向量的向量进行分区

假设您具有如下定义的2D矢量： <pre><code>fun interface Function<in T, out R> { operator fun invoke(p: T): R }

前端之家
2022-07-11 • 问答
当消息不具有使文档多样化的正确属性时，选择分区键

我有一个应用程序，它通过从另一个应用程序数据库中读取消息来将消息发布到Cosmos DB。我可以从其他

前端之家
2022-07-11 • 问答
Apache Spark中的中间阶段，没有父阶段和子阶段

我试图了解Apache Spark <code>(v2.2.3)</code>中已知的分区程序的好处，为此，我按照链接示例代码-<code>https://g

前端之家
2022-07-10 • 问答
Django模型按列表划分-唯一约束问题

我已经基于数据库类型字段（枚举值）创建了分区表PGSQL脚本。当尝试表示Django模型时，我收到以下错误

前端之家
2022-07-01 • 问答
将多个目录的CSV文件转换为PySpark中的实木复合地板

我有来自多个路径的CSV文件，这些文件不是s3存储桶中的父目录。所有表都具有相同的分区键。 s

前端之家
2022-06-26 • 问答
划分多个（可能）重叠范围的最简单算法

假设我有一个范围向量，我想将它们划分为多个分区。请注意，这与std :: partition的功能不同，后者是查

前端之家
2022-06-24 • 问答
用于连接的预分区数据帧

**我想对数据进行预分区，这是我正在使用的代码示例：** <pre><code> sparkSession.conf.set("spark.sql.auto

前端之家
2022-06-20 • 问答
date = dd-mm-yyyy和yyyy = {xxxx} / mm = {mm} / dd = {xx}之间的火花分割策略比较

如何选择日期上的哪种分区策略。我在数据框中有一列作为2020-02-19格式的日期。应该在写入时在分区列

前端之家
2022-06-19 • 问答
如何使用pyspark对SQL Server表进行分区（分区列为整数但日期格式（20170101至20200306））？

我有一个整数列，它实际上是一个日期。像这样 20170101 20170103 20170102 ..... 20200101 每个

前端之家
2022-06-17 • 问答
列值在加载KDB（q）中的两个分区表之间发生变化

我在磁盘上有两个分区的kdb表（一个称为交易，一个称为帐簿）。我通过创建数据使用 <pre><code>.Q.dpf

前端之家
2022-06-14 • 问答
根据嵌套列对BigQuery表进行分区

我正在尝试根据时间戳对BigQuery表进行分区，但是我要用于分区的列是一个嵌套列，并且具有父记录。例

前端之家
2022-06-13 • 问答
在不使用DataFrame或RDD的情况下，在所有Spark执行程序和驱动程序上执行脚本或小功能

我正在尝试使用Spark结构化流从Kafka主题读取数据。 Kafka经纪人已启用SSL。因此，我需要将私有CA证书安

前端之家
2022-06-10 • 问答
支持通过分区键查询而无需更改接口的存储库

我正在开发一个使用<code>IDocumentClient</code>对CosmosDB进行查询的应用程序。我的<code>GenericRepository</code>支

前端之家
2022-05-29 • 问答
如何在Spark中读取分区数据？

许多示例建议读取诸如<code>spark.read("path/partition=value/*")</code>之类的数据，但是如何从路径定义列

前端之家
2022-05-29 • 问答
如何从DB2中的特定分区中选择数据？

如何从DB2中的特定分区中选择数据，类似于 <pre><code>select * from table_name_partitioned partition (partition_name);

前端之家
2022-05-29 • 问答
随机分区大于200时会发生什么（数据帧中的spark.sql.shuffle.partitions 200（默认情况下））

spark sql聚合操作，可对数据进行混洗，即spark.sql.shuffle.partitions 200（默认情况下）。随机分区大于200时

前端之家
2022-05-27 • 问答
在citusDB中，如何找到数据分布方式？

在CitusDB中，我可以使用以下方法创建一个空表： <pre><code>CREATE TABLE table1 (col1 text, col2 text); </code></pre>

前端之家
2022-05-26 • 问答
适用于AWS DMS s3-target-endpoint的TimeBasedPartitioner

通过在我的数据管道之一上使用AWS DMS，我试图为s3-target-endpoint实现时基分区，就像io.confluent.connect.s3.S3Si

前端之家
2022-05-26 • 问答

首页

下一页
末页