频道导航

scala – 在Apache-Spark数据帧中求和距离

2020-10-27 Scala 前端之家

前端之家收集整理的这篇文章主要介绍了scala – 在Apache-Spark数据帧中求和距离，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

以下代码给出了每列中具有三个值的数据帧,如下所示.

import org.graphframes._
    import org.apache.spark.sql.DataFrame
    val v = sqlContext.createDataFrame(List(
      ("1","Al"),("2","B"),("3","C"),("4","D"),("5","E")
    )).toDF("id","name")

    val e = sqlContext.createDataFrame(List(
      ("1","3",5),("1","2",8),6),"4",7),"1","5",8)
    )).toDF("src","dst","property")
val g = GraphFrame(v,e)
val paths: DataFrame = g.bfs.fromExpr("id = '1'").toExpr("id = '5'").run()
paths.show()
val df=paths
df.select(df.columns.filter(_.startsWith("e")).map(df(_)) : _*).show

以上代码的OutPut如下：

+-------+-------+-------+                                                       
    |     e0|     e1|     e2|
    +-------+-------+-------+
    |[1,2,8]|[2,4,7]|[4,5,8]|
    +-------+-------+-------+

在上面的输出中,我们可以看到每列有三个值,它们可以解释如下.

e0 : 
source 1,Destination 2 and distance 8  

e1:
source 2,Destination 4 and distance 7

e2:
source 4,Destination 5 and distance 8

基本上e0,e1和e3是边缘.我想总结每列的第三个元素,即添加每个边的距离以获得总距离.我怎样才能做到这一点？

解决方法

它可以这样做：

val total = df.columns.filter(_.startsWith("e"))
 .map(c => col(s"$c.property")) // or col(c).getItem("property")
 .reduce(_ + _)

df.withColumn("total",total)

上一篇：scala类型的目的(=> A)=> O.下一篇：用于数据科学应用的Scala IDE(如RS

猜你在找的Scala相关文章

Scala的存在类型

Scala的存在类型存在类型也叫existential type，是对类型做抽象的一种方法。可以在你不知...

作者：前端之家时间：2020-12-21

Scala教程之:Option-Some-None

文章目录Option和SomeOption和NoneOption和模式匹配在java 8中，为了避免NullPointerExce...

作者：前端之家时间：2020-12-21

Scala教程之:静态类型

文章目录泛类型型变协变逆变不变类型上界类型下界内部类抽象类型复合类型自类型隐式参数隐...

作者：前端之家时间：2020-12-21

Scala的自定义类型标记

Scala的自定义类型标记 Scala中有很多千奇百怪的符号标记，看起来是那么的独特，就像是一杯...

作者：前端之家时间：2020-12-21

Scala教程之:面向对象的scala

文章目录面向对象的scalaUnified TypesClassesTraits 面向对象的scala 我们知道Scala是一种...

作者：前端之家时间：2020-12-21

Scala教程之:Enumeration

Enumeration应该算是程序语言里面比较通用的一个类型，在scala中也存在这样的类型，我们看...

作者：前端之家时间：2020-12-21

scala教程之:可见性规则

文章目录publicProtectedprivatescoped private 和 scoped protected 和java很类似，scala...

作者：前端之家时间：2020-12-21

Scala教程之:Either

在之前的文章中我们提到了Option，scala中Option表示存在0或者1个元素，如果在处理异常的时...

作者：前端之家时间：2020-12-21

Scala教程之:函数式的Scala

文章目录高阶函数强制转换方法为函数方法嵌套多参数列表样例类比较拷贝模式匹配密封类单例...

作者：前端之家时间：2020-12-21

Scala教程之:可扩展的scala

文章目录隐式类限制条件字符串插值s 字符串插值器f 插值器raw 插值器自定义插值器 Scala是...

作者：前端之家时间：2020-12-21

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章