用java实现皮尔逊相关系数计算

用java实现皮尔逊(Pearson)相关系数计算


package success;

import java.util.List;

/**

* 皮尔逊相关系数

*/

public class PearsonDemo {

    public static void main(String[] args) {

        test();

    }

    private static void test(){

        /*用于测试*/

        double[] x = new double[] { 38 ,13 ,27, 25, 18, 29, 30, 20, 23, 32, 38, 28, 34, 19, 20, 25, 16, 36, 25, 17, 24, 18, 30, 35, 22, 34, 12, 26, 29, 21};

        //double[] y = new double[] { 49 ,42, 45, 39, 30, 25, 39, 36, 39 ,45, 42, 50, 36, 48, 35, 42, 45, 29, 33, 27, 42, 43, 27, 39, 37, 36, 47, 37, 44, 34};

        double[] y = new double[] {114, 49, 84, 79, 87, 74, 77, 82, 80, 88, 123, 82, 98, 65, 61, 78, 51, 121, 78, 50, 75, 65, 113, 122, 78, 119, 45, 89, 102, 75};

        double score = getPearsonCorrelationScore(x, y);

        System.out.println(score);//0.6350393282549671

    }

    public static double getPearsonCorrelationScore(List<Double> x, List<Double> y) {

        if (x.size() != y.size())

            throw new RuntimeException("数据不正确!");

        double[] xData = new double[x.size()];

        double[] yData = new double[x.size()];

        for (int i = 0; i < x.size(); i++) {

            xData[i] = x.get(i);

            yData[i] = y.get(i);

        }

        return getPearsonCorrelationScore(xData,yData);

    }

    public static double getPearsonCorrelationScore(double[] xData, double[] yData) {

        if (xData.length != yData.length)

            throw new RuntimeException("数据不正确!");

        double xMeans;

        double yMeans;

        double numerator = 0;// 求解皮尔逊的分子

        double denominator = 0;// 求解皮尔逊系数的分母

        double result = 0;

        // 拿到两个数据的平均值

        xMeans = getMeans(xData);

        yMeans = getMeans(yData);

        // 计算皮尔逊系数的分子

        numerator = generateNumerator(xData, xMeans, yData, yMeans);

        // 计算皮尔逊系数的分母

        denominator = generateDenomiator(xData, xMeans, yData, yMeans);

        // 计算皮尔逊系数

        result = numerator / denominator;

        return result;

    }

    /**

    * 计算分子

    *

    * @param xData

    * @param xMeans

    * @param yData

    * @param yMeans

    * @return

    */

    private static double generateNumerator(double[] xData, double xMeans, double[] yData, double yMeans) {

        double numerator = 0.0;

        for (int i = 0; i < xData.length; i++) {

            numerator += (xData[i] - xMeans) * (yData[i] - yMeans);

        }

        return numerator;

    }

    /**

    * 生成分母

    *

    * @param yMeans

    * @param yData

    * @param xMeans

    * @param xData

    * @return 分母

    */

    private static double generateDenomiator(double[] xData, double xMeans, double[] yData, double yMeans) {

        double xSum = 0.0;

        for (int i = 0; i < xData.length; i++) {

            xSum += (xData[i] - xMeans) * (xData[i] - xMeans);

        }

        double ySum = 0.0;

        for (int i = 0; i < yData.length; i++) {

            ySum += (yData[i] - yMeans) * (yData[i] - yMeans);

        }

        return Math.sqrt(xSum) * Math.sqrt(ySum);

    }

    /**

    * 根据给定的数据集进行平均值计算

    *

    * @param

    * @return 给定数据集的平均值

    */

    private static double getMeans(double[] datas) {

        double sum = 0.0;

        for (int i = 0; i < datas.length; i++) {

            sum += datas[i];

        }

        return sum / datas.length;

    }

}

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 皮尔逊系数 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮...
    逍遥_yjz阅读 3,665评论 0 0
  • 皮尔逊相关系数 两种最常用的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等级相关系数。 他可以用...
    茶酒qqq阅读 17,007评论 4 19
  • 一、皮尔逊(Pearson)相关系数 1、协方差能完美的解释两个变量之间相关的方向,但在解释强度上却不太行,举个例...
    SteelDK阅读 30,290评论 0 5
  • 1. 定义 皮尔逊相关系数用于度量两个变量(X和Y)之间的线性相关程度,其值介于-1与1之间。这种线性相关直观表述...
    JeremyL阅读 17,370评论 0 5
  • 皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。假设有两个变量X...
    zhangxu0636阅读 4,727评论 0 1