๋ฐ์ดํฐ์ ๋ ๋ณ์๊ฐ ์ ํ๊ด๊ณ๋ฅผ ๋ํ๋ด๋ ์ฒ๋์ ๋ํด์ ์์๋ณธ๋ค.
์ ํ๊ด๊ณ
๋ ๋ณ์์ ๊ด๊ณ๋ฅผ ์์๋ณด๋ ๊ฒ์ ๋งค์ฐ ์ค์ํ๋ค. ์ด๋ ํ ์ฐ๊ด์ฑ์ ํตํ์ฌ ์ ์๋ฏธํ ์ ๋ณด๋ฅผ ์ด๋์ด ๋ผ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ์ด๋ฌํ ์ ํ๊ด๊ณ๋ฅผ ์์๋ด๋ ์ฒ๋๋ 3๊ฐ์ง ์ ๋๊ฐ ์๋ ค์ ธ ์๋ค.
๊ณต๋ถ์ฐ(Covarience)
๊ณต๋ถ์ฐ์ ์ง๊ด์ ์ผ๋ก ์ดํดํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. ์์ ๋ณด๋ฉด, ๊ฒฐ๊ตญ X์์ X์ ํ๊ท ์ ๋นผ๊ณ , Y์์ Y์ ํ๊ท ์ ๋บ๋ค ๊ณฑํ ๊ฒ๋ค์ ๋ชจ๋ ๋ํ๋ค ๋ฐ์ดํฐ์ ๊ฐ์๋ก ๋๋๋ ๊ฒ์ด๋ค. ๊ทธ๋ ๋ค๋ฉด ์์ ์๋ ๋ง ํ์ธํด๋ณด์.
์์ ๊ฐ์ ๊ทธ๋ฆผ์ด ๋๋ค.
์ด๋ฌํ ํน์ง ๋๋ฌธ์, ๊ฒฐ๊ณผ์ ์ผ๋ก ์์ ์๊ด๊ด๊ณ๋ฅผ ๊ฐ์ง๋ ๊ฒฝ์ฐ๋ +, ์์ ์๊ด๊ด๊ณ๋ -๊ฐ ๋๋ค.
0์ด ๋์ค๋ ๊ฒฝ์ฐ
๊ฒฐ๋ก ๋ถํฐ ๋งํ์๋ฉด x, y์ถ์ ๋ํด ํํํ ์ง์ ์ ๋ํด ๋์นญ์ด๋ฉด ๋ชจ๋ 0์ด ๋์จ๋ค. ์ค์ ๋ก ๊ทธ๋ฆผ์ ๊ทธ๋ ค๋ณด๊ณ ์์ ์์ ์ ํด๋ณด๋๋ก ํ์.
์๊ด๊ณ์(Coefficient of correlation)
์๊ด ๊ณ์๋ ์์ ๊ฐ์ ์ ๊ทํํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก -1~+1์ ๊ฐ์ผ๋ก ๋ง๋ค์ด ๋ณด๋ค ์์น์ ์ผ๋ก ์ ํํ ํ๋จํ ์ ์๋ค. ์ด๋ ๋ฒกํฐ์ ๋ด์ ๊ณผ ๋์ผํ ์ฐ์ฐ์ด๋ค.
๊ณต๋ถ์ฐ ํ๋ ฌ
๊ณต๋ถ์ฐ ํ๋ ฌ์ ๋ค๋ณ์ ๋ฐ์ดํฐ์ ๊ณต๋ถ์ฐ์ ๋ํ๋ธ๋ค. ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํํ๋๋ค.
\\begin{aligned} \\operatorname{Cov}(X) &= \operatorname{E}((X-\mu)(X-\mu)^\top) \\ &= \begin{bmatrix} \\operatorname{Cov}(X_1, X_1) & \operatorname{Cov}(X_1, X_2) & \cdots & \operatorname{Cov}(X_1, X_n) \\ \\operatorname{Cov}(X_2, X_1) & \operatorname{Cov}(X_2, X_2) & \cdots & \operatorname{Cov}(X_2, X_n) \\ \\vdots & \vdots & \ddots & \vdots \\ \\operatorname{Cov}(X_n, X_1) & \operatorname{Cov}(X_n, X_2) & \cdots & \operatorname{Cov}(X_n, X_n) \\end{bmatrix} \\end{aligned}-
์ฃผ ๋๊ฐ์ ์ ๊ฐ ๋ณ์์ ๋ถ์ฐ์ ๋ํ๋ธ๋ค.
-
๋น๋๊ฐ์ ์ ๋ณ์๊ฐ์ ๊ณต๋ถ์ฐ์ ๋ํ๋ธ๋ค.
-
๋์นญํ๋ ฌ์ด๋ค.