user-defined-functions

使用Spark Scala解析String列以获取日期格式的数据

我在.avro文件中具有String类型的以下列（TriggeredDateTime），我需要获取yyyy-MM-dd HH：mm：ss格式的数据（如

前端之家
2022-08-13 • 问答
如何将表的一列传递给函数？

<a href="https://i.stack.imgur.com/Zxvuo.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/Zxvuo.png" alt="enter image

前端之家
2022-08-13 • 问答
Spark SQL错误处理和源信息

我正在使用以下代码在bacth中读取多个文件： <pre><code>forkJoin([ source1$.pipe(catchError(error => of(error)))

前端之家
2022-08-13 • 问答
类型转换问题：返回为整数而不是float / type

我正试图将平均值返回给计算每个数组的平均元素数的main。 Sum是一个整数，numTweets是一个整数。我尝试

前端之家
2022-08-13 • 问答
在pyspark dataframe列内的数组中进行算术

我有一个具有以下结构的pyspark数据框 <a href="https://i.stack.imgur.com/5eWLd.png" rel="nofollow noreferrer"><img s

前端之家
2022-08-13 • 问答
迭代计数器，每周总运行小时数

Excel VBA：我正在努力使用迭代计数器的循环结构来报告每个员工的总工作时间。例如：<br/> <br/>

前端之家
2022-08-13 • 问答
数组中的DB2 C UDF参数

我正在使用DB2 10.5 Linux，我需要创建一个C UDF，它可以获取150个以上的参数（加上null指示符）。是

前端之家
2022-08-13 • 问答
如何修复代码中的“ UnboundLocalError：分配前引用的本地变量” dc”？

在调用dc之前，我很难找到确切引用了dc的位置。任何帮助，将不胜感激。代码摘自<a href="https://cfs.nrcan.g

前端之家
2022-08-13 • 问答
尝试将元素插入到pyspark数据帧的数组列时，输出奇怪

我试图在pyspark数据框的数组列的开头插入0。 <a href="https://i.stack.imgur.com/rPl9a.png" rel="nofollow noreferr

前端之家
2022-08-13 • 问答
在pyspark UDF内部使用类方法

您好，数据工程师！我正在尝试使用名为<a href="https://github.com/sffjunkie/astral/blob/master/src/astral.py" re

前端之家
2022-08-12 • 问答
具有ptyhon错误代码的Hive UDF返回代码20001

<div class =“ snippet” data-lang =“ js” data-hide =“ false” data-console =“ true” data-babel =“ false”> <div cl

前端之家
2022-08-12 • 问答
如何根据条件附加到文本

如何根据前一列的值在结果列中创建公式 <a href="https://i.stack.imgur.com/ZaAnB.png" rel="nofollow noreferrer"><img src="

前端之家
2022-08-12 • 问答
UDF功能在黑斑羚收到汉字后变为？

UDF可在配置单元中使用，但不能在黑斑羚中使用。 <a href="https://i.stack.imgur.com/pdCzU.png" rel="nofollow

前端之家
2022-08-12 • 问答
使用经标准化的UDF进行pipline时，DataFrame.withColumn（）的工作非常缓慢

如今，我正在使用ML和Pipeline pypark API实现模糊分类器，我的问题是在生成规则库（RB）的最后阶段，我想

前端之家
2022-08-12 • 问答
Excel VBA（UDF）返回#VALUE！由于限制为255个字符

我对Excel中的VBA不太熟悉。无论字符数限制如何，我都需要VBA函数文本值来返回（如果需要限制，则560就

前端之家
2022-08-12 • 问答
尝试执行包含通过联合身份验证连接的表名的DB2 UDF时出错

我已经在Database1中创建了一个DB2 UDF，它通过联合身份验证设置引用了Database2中的一个表（表名2）。该函

前端之家
2022-08-12 • 问答
在工作表的2列中查找唯一值

我正在尝试创建一个UDF以查找包含2列的唯一值。我有一张纸，其中包含有关公司员工的数据。我需要计

前端之家
2022-08-12 • 问答
用户定义的函数使用mutate和case_when

我有学校数据显示每个种族组中的学生百分比（黑人学生/总学生）。我的示例数据如下： <pr

前端之家
2022-08-11 • 问答
用户代理解析器（ua-parser）减慢了EMR上的Spark

我在UDF中使用<a href="https://github.com/ua-parser/uap-scala" rel="nofollow noreferrer">ua-parser</a>来解析用户代理信息。

前端之家
2022-08-11 • 问答
如何将两个数据帧转换为行的元组列表

我有一个数字元组列表，它从数据帧中提取数据。我从对应于数字（SNO）的数据框中提取数据。我想将

前端之家
2022-08-11 • 问答
dataset.collectAsList（）导致集群中的java.lang.ClassCastException

当我使用IntelliJ在Local中执行<code>List<Row> rows = (List<Row>) dataset.collectAsList();</code>时，我得到了结

前端之家
2022-08-11 • 问答
在pyspark

我的pyspark数据框中有两个时间戳列。我想创建第三列，其中包含两个时间戳之间的时间戳小时数组。 </p

前端之家
2022-08-11 • 问答
如何删除属于模块的功能？

我正在Linux上使用DB2 10.1修订包1企业版。我想删除功能我检查了该功能是否存在： <pre><

前端之家
2022-08-11 • 问答
Spark UDF：如何在每一行上编写UDF以提取嵌套结构中的特定值？

我正在Java中使用Spark处理XML文件。来自databricks的spark-xml软件包用于将xml文件读入数据帧。示例xml

前端之家
2022-08-11 • 问答
替换文本文件中的每4个单词字符串

<pre><code>def abc(filename): infile = open(filename, 'r+') read = infile.read() lst = read.split() for i in lst:

前端之家
2022-08-11 • 问答
是否将“表值函数”与EFCore映射？

我在SQLSERVER中定义了一个表值函数，如下所示： <pre><code> USE [AZPDBDEMOGZ] GO /****** Object: UserDefine

前端之家
2022-08-11 • 问答
python selenium在文本字段中增加的值最多x

我正在使用输入和硒webdriver代码来填充网页上的特定文本字段。这是代码： <pre><code>ask_max_pric

前端之家
2022-08-11 • 问答
功能故障

<strong> main（）</strong>函数代码应该调用一个函数<strong> blah（int，int）</strong>，该代码显然在接受第二

前端之家
2022-08-10 • 问答
结构化流式传输多行到熊猫udf

我正在编写一个结构化的流作业，该作业从eventhub接收数据。经过一些准备后，我在每一行上应用了panda

前端之家
2022-08-10 • 问答
坚持使用BigQuery UDF

我想在Bigquery中生成一个函数，每次从该函数先前生成的值开始调用该函数时，该函数都应返回唯一的序

前端之家
2022-08-10 • 问答