频道导航

scala – 如何在spark-ml CrossValidatorModel中获得最佳逻辑回归的系数？

2020-10-27 Scala 前端之家

前端之家收集整理的这篇文章主要介绍了scala – 如何在spark-ml CrossValidatorModel中获得最佳逻辑回归的系数？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我使用逻辑回归和spark-ml管道训练一个简单的CrossValidatorModel.我可以预测新数据,但我想超越黑盒子并对系数进行一些分析

val lr = new LogisticRegression().
  setFitIntercept(true).
  setMaxIter(maxIter).
  setElasticNetParam(alpha).
  setStandardization(true).
  setFamily("binomial").
  setWeightCol("weight").
  setFeaturesCol("features").
  setLabelCol("response")

val assembler = new VectorAssembler().
  setInputCols(Array("feat1","feat2")).
  setOutputCol("features")

val modelPipeline = new Pipeline().
  setStages(Array(assembler,lr))

val evaluator = new BinaryClassificationEvaluator()
  .setLabelCol("response")

然后我定义了一个参数网格,我在网格上训练以获得最佳模型和AUC

val paramGrid = new ParamGridBuilder().
  addGrid(lr.regParam,lambdas).
  build()

val pipeline = new CrossValidator().
  setEstimator(modelPipeline).
  setEvaluator(evaluator).
  setEstimatorParamMaps(paramGrid).
  setNumFolds(nfolds)

val cvModel = pipeline.fit(train)

如何获得最佳逻辑回归模型的系数(beta)？

解决方法

提取最佳模型：

val bestModel = cvModel.bestModel match {
  case pm: PipelineModel => Some(pm)
  case _ => None
}

查找逻辑回归模型：

val lrm = bestModel
  .map(_.stages.collect { case lrm: LogisticRegressionModel => lrm })
  .flatMap(_.headOption)

提取系数：

lrm.map(m => (m.intercept,m.coefficients))

快速和脏的等价物：

val lrm: LogisticRegressionModel = cvModel
  .bestModel.asInstanceOf[PipelineModel]
  .stages
  .last.asInstanceOf[LogisticRegressionModel]

(lrm.intercept,lrm.coefficients)

上一篇：Scala覆盖方法,子类为参数类型下一篇：Combinator /：在scala中

猜你在找的Scala相关文章

Scala的存在类型

Scala的存在类型存在类型也叫existential type，是对类型做抽象的一种方法。可以在你不知...

作者：前端之家时间：2020-12-21

Scala教程之:Option-Some-None

文章目录Option和SomeOption和NoneOption和模式匹配在java 8中，为了避免NullPointerExce...

作者：前端之家时间：2020-12-21

Scala教程之:静态类型

文章目录泛类型型变协变逆变不变类型上界类型下界内部类抽象类型复合类型自类型隐式参数隐...

作者：前端之家时间：2020-12-21

Scala的自定义类型标记

Scala的自定义类型标记 Scala中有很多千奇百怪的符号标记，看起来是那么的独特，就像是一杯...

作者：前端之家时间：2020-12-21

Scala教程之:面向对象的scala

文章目录面向对象的scalaUnified TypesClassesTraits 面向对象的scala 我们知道Scala是一种...

作者：前端之家时间：2020-12-21

Scala教程之:Enumeration

Enumeration应该算是程序语言里面比较通用的一个类型，在scala中也存在这样的类型，我们看...

作者：前端之家时间：2020-12-21

scala教程之:可见性规则

文章目录publicProtectedprivatescoped private 和 scoped protected 和java很类似，scala...

作者：前端之家时间：2020-12-21

Scala教程之:Either

在之前的文章中我们提到了Option，scala中Option表示存在0或者1个元素，如果在处理异常的时...

作者：前端之家时间：2020-12-21

Scala教程之:函数式的Scala

文章目录高阶函数强制转换方法为函数方法嵌套多参数列表样例类比较拷贝模式匹配密封类单例...

作者：前端之家时间：2020-12-21

Scala教程之:可扩展的scala

文章目录隐式类限制条件字符串插值s 字符串插值器f 插值器raw 插值器自定义插值器 Scala是...

作者：前端之家时间：2020-12-21

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章