以下是我们的主要选项
Posted: Thu Jan 16, 2025 8:47 am
的简要概述,以及我们如何在它们之间做出选择以获得最新的结果: 机器学习模型与相关数据:机器学习可以建模并解释复杂的变量相互作用。过去,我们曾报告过机器学习模型的导数。然而,这些结果很难创建,很难理解,也很难验证。因此,我们决定计算简单的相关统计数据。 皮尔逊相关性与斯皮尔曼相关性:最常见的相关性度量是皮尔逊相关性,尽管它只测量线性相关性。这一限制很重要:我们没有理由认为与排名相关的有趣相关性都是线性的。相反,我们选择使用斯皮尔曼相关性。 斯皮尔曼相关性仍然很常见,它可以很好地测量任何单调相关性。
这是一个单调性的例子:我的同事中有多少人当天吃过午饭,这一数字与一天中的时间完全单调相关。它不是一条直线,所以不是线性相关,但它永远不会减少,所以它是单调相关的。 这是一个线性示例:假设我以恒定的 伯利兹数字数据 速率阅读,那么我能阅读的页数与我花在阅读上的时间长度呈线性相关。 平均相关系数与汇总相关系数: 我们收集了 多个查询的数据。对于每个查询,我们可以通过计算相关系数来衡量排名位置与特定指标的相关性。 但是,我们不想报告 多个相关系数;我们希望报告一个数字,该数字反映了数据在整个数据集中的相关性,我们希望显示该数字的统计显著性。
有两种常用技术可以做到这一点: 计算相关系数的平均值。为了显示统计意义,我们可以报告平均值的标准误差。 汇总所有 的结果并计算全局相关系数。为了显示统计意义,我们可以通过一种称为的技术来计算标准误差。 平均相关系数和合并相关系数都是有意义的统计数据。但是,显示合并相关系数标准误差所需的引导程序比使用平均值标准误差要少见。 所以我们选择了 #。 费舍尔变换与非费舍尔变换: 在对一组相关系数求平均值时,有时人们会计算系数的费舍尔变换的平均值(在应用逆费舍尔变换之前),而不是计算相关系数的平均值。这不适合我们的问题,因为: 它很可能会失败。
这是一个单调性的例子:我的同事中有多少人当天吃过午饭,这一数字与一天中的时间完全单调相关。它不是一条直线,所以不是线性相关,但它永远不会减少,所以它是单调相关的。 这是一个线性示例:假设我以恒定的 伯利兹数字数据 速率阅读,那么我能阅读的页数与我花在阅读上的时间长度呈线性相关。 平均相关系数与汇总相关系数: 我们收集了 多个查询的数据。对于每个查询,我们可以通过计算相关系数来衡量排名位置与特定指标的相关性。 但是,我们不想报告 多个相关系数;我们希望报告一个数字,该数字反映了数据在整个数据集中的相关性,我们希望显示该数字的统计显著性。
有两种常用技术可以做到这一点: 计算相关系数的平均值。为了显示统计意义,我们可以报告平均值的标准误差。 汇总所有 的结果并计算全局相关系数。为了显示统计意义,我们可以通过一种称为的技术来计算标准误差。 平均相关系数和合并相关系数都是有意义的统计数据。但是,显示合并相关系数标准误差所需的引导程序比使用平均值标准误差要少见。 所以我们选择了 #。 费舍尔变换与非费舍尔变换: 在对一组相关系数求平均值时,有时人们会计算系数的费舍尔变换的平均值(在应用逆费舍尔变换之前),而不是计算相关系数的平均值。这不适合我们的问题,因为: 它很可能会失败。