-
哪种距离测量最适合值范围差异很大的特征?
我提供了具有不同功能的记录。总共我有8个功能。有些是二进制的,但有些值的范围是0到1000万。我的 -
二项式回归中标准化系数的Beta函数
我正在尝试对我的二项式回归进行标准化的参数估计。使用了reghelper软件包中的beta函数。我的结果变量h -
CDF标准化数据
我真的需要你的帮助。我想在0到1之间缩放数据,然后将其聚类。使用累积分布函数(CDF)预先对数据进 -
如何获得多级调解的标准化输出?
我使用Tingley等人的中介程序包计算了多级中介。 2013。我的输出如下所示: <pre><code>Causal Mediation Anal -
减少离散偏斜数据中的偏斜
我有数据<code>carData::GSSvocab</code>,如果可以减少变量<code>educ</code>和<code>vocab</code>的偏度,我应该尝试。 -
在长而宽的数据框中使用sklearn标准化熊猫列
我有一个很长的数据帧,它也很宽,我的RAM无法处理,因此我必须对其列进行标准化。由于无法一次全 -
用许多零标准化像素输入数据
我想为神经网络标准化输入数据。 数据如下: <pre><code>data= np.array([[0,0,0,0,233,2,0,0,0],[0,0,0,23,50, -
H2O是否不应该为正则化GLM模型(套索,山脊,弹性网)标准化分类预测器?
<blockquote> “套索方法需要对回归变量进行初始标准化, 这样惩罚方案对所有回归者都是公平的。 -
lmer系数是否标准化?
我有一个非常基本的问题;也许有点太基础了,无法找到有用的应对措施。 我正在使用使用以下 -
像路径一样命名数据框
我有很多需要标准化的CSV。为此,我创建了一个字典,到目前为止,我拥有的功能如下: <pre><code>inp -
PCA面板数据? (Python,PCA,Scikit.learn)
数据集如下: <ul> <li> <em>所有特征<code>x</code>都是数字化的和可缩放的,除了<code>name</code>(当前与 -
样本平均值的标准化(标准化z)值
我从一个目标种群中抽取了一个大小为48的样本,样本的平均值为μ= 10.8,σ=4。样本平均值为8.3。 -
使用另一个数据框缩放数据框中的变量
我有一个带有以下变量的数据框 <pre><code>dat <- data.frame(cell.ID = 1:10, cell.name = letters[1:10], -
幂函数正常人口
我希望从具有均值μ和已知方差σ²的正态总体计算幂函数。 我正在尝试修改“帮助”代码: <p -
规范化数据,其中一列包含值的离散子集(以R表示)
我知道这可能是一个重新安排的问题,但是我无法想象如何最好地做到这一点。 我可以按照<a href= -
这会分别缩放每列吗? [R
如果我想标准化第2列和第3列(每个列分别进行标准化),这行得通吗? <pre><code>df[c(2:3)] <- scale(df -
R
我有一个面板数据集,并且正在运行固定效果回归。我的因变量是CDS点差,我有7个自变量,它们是宏观 -
R中固定效应回归的标准化系数
我正在运行固定效果面板回归。我需要标准化的beta来进行回归。有人可以建议怎么做,因为“ lm.beta” -
使用相同单位的数据对PCA和SVD的不同结果
一开始,我有400,000张图像被标准化(灰度值增加)。之后,我对每张图片进行了DFT,并获得了3200个绝对 -
如何将PCA与具有相同单位的值的数据一起使用
我的数据包含400000个样本,其中3200个值的<strong>相同单位</strong>(400000x3200)。我知道,当数据具有<stron -
R中的零膨胀过度分散计数数据glmmTMB错误
我正在处理零膨胀和过度分散且具有随机影响的计数数据(可用<a href="https://figshare.com/s/ace5b44bc12394a7c46d" -
反向Z分数
如果您有一个仅包含z得分变量的数据向量,是否可以不使用原始度量而将z分数值反转以获得原始度量? -
标准化熊猫数据
我使用zscore方法删除了数据框的异常值。 <pre><code>from scipy import stats x_final=x_drop[(np.abs(stats.zscore(x_drop -
R与SPSS中具有虚拟变量的标准化回归系数
我发现,使用虚拟编码变量使用R和SPSS计算的线性回归模型在标准化(β)系数上存在令人费解的差异。 -
将列的平均值等于100,并按比例转换列中的其他值(Pandas Python)
我有一个这样的熊猫数据框: <pre><code>City Variable1 c1 1234 c2 2222 c3 1111 c4 2224 -
如何规范pyspark中的数据框?
我正在尝试规范用户项目矩阵,但是我想使用以下公式: <pre><code>(df.values-df.values.min())/(df.values.max()- -
StandardScaler提供不一致的标准偏差
我的问题设置如下:Python 3.7,Pandas版本1.0.3和sklearn版本0.22.1。我通常会使用<a href="https://scikit-learn.org/sta -
在计算标准化患病率之前,采用随机路径法(使用调查包)对体重人口进行抽样的正确方法
我们使用随机路线抽样方法对人口进行了调查,我们走遍了每条街道,每隔5个门就敲门,回应率为25% -
在Python中标准化变量
我有以下代码: <pre><code>var_list = ['a', 'b', 'c', 'd', 'd', 'e', 'f' -
对给定的数据集执行特征缩放
我最近开始进行机器学习,并尝试对我的数据集进行特征缩放。我不确定应该采用哪种缩放方法以及如