๋ฐ์ดํ„ฐ์˜ ๋‘ ๋ณ€์ˆ˜๊ฐ„ ์„ ํ˜•๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ฒ™๋„์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณธ๋‹ค.

์„ ํ˜•๊ด€๊ณ„

๋‘ ๋ณ€์ˆ˜์˜ ๊ด€๊ณ„๋ฅผ ์•Œ์•„๋ณด๋Š” ๊ฒƒ์€ ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค. ์–ด๋– ํ•œ ์—ฐ๊ด€์„ฑ์„ ํ†ตํ•˜์—ฌ ์œ ์˜๋ฏธํ•œ ์ •๋ณด๋ฅผ ์ด๋Œ์–ด ๋‚ผ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ด๋Ÿฌํ•œ ์„ ํ˜•๊ด€๊ณ„๋ฅผ ์•Œ์•„๋‚ด๋Š” ์ฒ™๋„๋Š” 3๊ฐ€์ง€ ์ •๋„๊ฐ€ ์•Œ๋ ค์ ธ ์žˆ๋‹ค.

๊ณต๋ถ„์‚ฐ(Covarience)

๊ณต๋ถ„์‚ฐ์„ ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ์‹์„ ๋ณด๋ฉด, ๊ฒฐ๊ตญ X์—์„œ X์˜ ํ‰๊ท ์„ ๋นผ๊ณ , Y์—์„œ Y์˜ ํ‰๊ท ์„ ๋บ€๋’ค ๊ณฑํ•œ ๊ฒƒ๋“ค์„ ๋ชจ๋‘ ๋”ํ•œ๋’ค ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ„๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์•ˆ์— ์žˆ๋Š” ๋งŒ ํ™•์ธํ•ด๋ณด์ž.

์œ„์™€ ๊ฐ™์€ ๊ทธ๋ฆผ์ด ๋œ๋‹ค.

์ด๋Ÿฌํ•œ ํŠน์ง• ๋•Œ๋ฌธ์—, ๊ฒฐ๊ณผ์ ์œผ๋กœ ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๊ฐ€์ง€๋Š” ๊ฒฝ์šฐ๋Š” +, ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„๋Š” -๊ฐ€ ๋œ๋‹ค.

0์ด ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ

๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋งํ•˜์ž๋ฉด x, y์ถ•์— ๋Œ€ํ•ด ํ‰ํ–‰ํ•œ ์ง์„ ์— ๋Œ€ํ•ด ๋Œ€์นญ์ด๋ฉด ๋ชจ๋‘ 0์ด ๋‚˜์˜จ๋‹ค. ์‹ค์ œ๋กœ ๊ทธ๋ฆผ์„ ๊ทธ๋ ค๋ณด๊ณ  ์œ„์˜ ์ž‘์—…์„ ํ•ด๋ณด๋„๋ก ํ•˜์ž.

์ƒ๊ด€๊ณ„์ˆ˜(Coefficient of correlation)

์ƒ๊ด€ ๊ณ„์ˆ˜๋Š” ์œ„์˜ ๊ฐ’์„ ์ •๊ทœํ™”ํ–ˆ๋‹ค๊ณ  ๋ณด๋ฉด ๋œ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ -1~+1์˜ ๊ฐ’์œผ๋กœ ๋งŒ๋“ค์–ด ๋ณด๋‹ค ์ˆ˜์น˜์ ์œผ๋กœ ์ •ํ™•ํžˆ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ๋ฒกํ„ฐ์˜ ๋‚ด์ ๊ณผ ๋™์ผํ•œ ์—ฐ์‚ฐ์ด๋‹ค.

๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ

๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ์€ ๋‹ค๋ณ€์ˆ˜ ๋ฐ์ดํ„ฐ์˜ ๊ณต๋ถ„์‚ฐ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ด๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํ‘œํ˜„๋œ๋‹ค.

\\begin{aligned} \\operatorname{Cov}(X) &= \operatorname{E}((X-\mu)(X-\mu)^\top) \\ &= \begin{bmatrix} \\operatorname{Cov}(X_1, X_1) & \operatorname{Cov}(X_1, X_2) & \cdots & \operatorname{Cov}(X_1, X_n) \\ \\operatorname{Cov}(X_2, X_1) & \operatorname{Cov}(X_2, X_2) & \cdots & \operatorname{Cov}(X_2, X_n) \\ \\vdots & \vdots & \ddots & \vdots \\ \\operatorname{Cov}(X_n, X_1) & \operatorname{Cov}(X_n, X_2) & \cdots & \operatorname{Cov}(X_n, X_n) \\end{bmatrix} \\end{aligned}
  • ์ฃผ ๋Œ€๊ฐ์„ ์€ ๊ฐ ๋ณ€์ˆ˜์˜ ๋ถ„์‚ฐ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค.

  • ๋น„๋Œ€๊ฐ์„ ์€ ๋ณ€์ˆ˜๊ฐ„์˜ ๊ณต๋ถ„์‚ฐ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค.

  • ๋Œ€์นญํ–‰๋ ฌ์ด๋‹ค.