correlation

高中數學相關係數

高中數學相關係數

一維數據

  • 一維數據 \(X\):\(x_1, x_2, ..., x_n\)
  • 算術平均數 \(\mu_X=\frac{1}{n}(x_1+x_2+\cdots+x_n)\)
  • 標準差 \(\sigma_X=\sqrt{\frac{1}{n}[(x_1-\mu_X)^2+(x_2-\mu_X)^2+\cdots+(x_n-\mu_X)^2]}\)

二維數據

  • 二維數據 \((X, Y)\):\((x_1, y_1), (x_2, y_2), ..., (x_n, y_n)\)
  • 算術平均數 \(\mu_X=\frac{1}{n}(x_1+x_2+\cdots+x_n)\)
  • 算術平均數 \(\mu_Y=\frac{1}{n}(y_1+y_2+\cdots+y_n)\)
  • 標準差 \(\sigma_X=\sqrt{\frac{1}{n}[(x_1-\mu_X)^2+(x_2-\mu_X)^2+\cdots+(x_n-\mu_X)^2]}\)
  • 標準差 \(\sigma_Y=\sqrt{\frac{1}{n}[(y_1-\mu_Y)^2+(y_2-\mu_Y)^2+\cdots+(y_n-\mu_Y)^2]}\)
  • 相關係數 \(r_{X, Y}=\frac{(x_1-\mu_X)(y_1-\mu_Y)+(x_2-\mu_X)(y_2-\mu_Y)+\cdots+(x_n-\mu_X)(y_n-\mu_Y)}{n\sigma_X\sigma_Y}\)
  • 迴歸直線(最適合直線)方程式 \(y-\mu_Y=r_{X, Y}\frac{\sigma_Y}{\sigma_X}(x-\mu_X)\)

範例

  • 二維數據 \((X, Y)\):\((1, 2), (2, 7), (5, 6)\)
  • 算術平均數 \(\mu_X=\frac{1}{3}(1+2+5)=2.\bar{6}\)(在Microsoft Excel對應的函數為AVERAGE)
  • 算術平均數 \(\mu_Y=\frac{1}{3}(2+7+6)=5\)(在Microsoft Excel對應的函數為AVERAGE)
  • 標準差 \(\sigma_X=\sqrt{\frac{1}{3}[(1-2.\bar{6})^2+(2-2.\bar{6})^2+(5-2.\bar{6})^2]}\approx 1.7\) (在Microsoft Excel對應的函數為STDEV.P)
  • 標準差 \(\sigma_Y=\sqrt{\frac{1}{3}[(2-5)^2+(7-5)^2+(6-5)^2]}\approx 2.16\) (在Microsoft Excel對應的函數為STDEV.P)
  • 相關係數 \(r_{X, Y}=\frac{(1-2.\bar{6})(2-5)+(2-2.\bar{6})(7-5)+\cdots+(5-2.\bar{6})(6-5)}{3\cdot 1.7\cdot 2.16}\approx 0.545\)(在Microsoft Excel對應的函數為CORREL)
  • 迴歸直線(最適合直線)方程式 \(y-5=0.545\cdot\frac{2.16}{1.7}\cdot(x-2.\bar{6})=0.69(x-2.\bar{6})\)

No comments:

Post a Comment