ํต๊ณ ๊ฐ๋ ์ ๋ฆฌ์ ์์ ํต๊ณํ์ด๋ผ๋ ํ๋ฌธ์ ๋ํด ์์๋ณธ๋ค.
ํต๊ณ๋ ์ ๊ณต๋ถํ๋๊ฐ
๋ฏธ๋๋ฅผ ์๊ธฐ ์ํด์, ์ง๋จ์ ํน์ง์ ์๊ธฐ ์ํด์
์ฐ๋ฆฌ๋ ๊ตฐ์ค์ ํน์ง์ ๋ํด ์ ํ์๊ฐ ์๋ค. ์๋ฅผ ๋ค์ด ๋ฌผ๊ฑด์ ํ๋ค๊ณ ์๊ฐํด๋ณด์. ์ด ๋ฌผ๊ฑด์ด ๋ง์ด ํ๋ฆด์ง ์๋์ง๋ ํด๋น ์๋น์์ ํน์ง์ ๋ถ์ํ ํ์๊ฐ ์๋ค.
์ฃผ์ ํต๊ณํ ๊ฐ๋
- ๋ชจ์(population parameter)
- ๋ชจ์ง๋จ (population)์ ํน์ฑ์ ๋ํ๋ด๋ ์ฒ๋, ํน์ง
- ํต๊ณ๋(statistic)
- ํ๋ณธ(sample)์ ํน์ฑ์ ๋ํ๋ด๋ ์ฒ๋, ํน์ง
๊ฒฐ๊ณผ์ ์ผ๋ก ์ฐ๋ฆฌ๋ ํ๋ณธ์ ํต๊ณ๋์ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ์๋ฅผ ์ถ์ ํ๋ค.
๋ฐ์ดํฐ์ ํํ
- interval data (numerical data)
- ์์นํ ๋ฐ์ดํฐ. ์๊ธ, ๋ฐ์๋ฅ ๊ฐ์ด ์ค์ ๋ฒ์์ ์ซ์๊ฐ ๋์ฌ ์ ์๋ ๊ฒ์ ๋งํ๋ค.
- ์ด๋ฐ ์ค์ํ ๋ฐ์ดํฐ๋ ๋ด๊ฐ ๊ตฌ๊ฐ์ ๋๋์ด ๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ก ์ฒ๋ฆฌ๋ฅผ ํ ์ ์๋ค.
- nominal data (categorical data)
- ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ด๋ค. ๋ฒ์ฃผํ ๋ฐ์ดํฐ์๋ ์์ด์ด ์กด์ฌํ๋ ๋ฐ์ดํฐ, ๊ทธ๋ ์ง ์์ ๋ฐ์ดํฐ๋ก ๋๋ ์ ์๋ค.
- ์๋ฅผ ๋ค๋ฉด, ์์์ ๊ฐ์ ์์ด ๋ฐ์ดํฐ์ ์ฑ๋ณ๊ณผ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์กด์ฌํ๋ค.
- ๋ณดํต ๊ณ์ฐ์ ์ํด ์ซ์๋ก ๋์ฒดํ๋ค.
- ๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ ํด๋น ๋ฒ์ฃผ์ ๋ํ ๋น๋์๋ฅผ ์ธ๋ ๋์๋ถํฌํ๊ฐ ๋ง์ด ์ฌ์ฉ๋๋ค.
- ๋๋ ํ์ด์ฐจํธ๋ ๋ง์ด ์ฌ์ฉ๋๋ค.
ํ์คํ ๊ทธ๋จ
์์นํ ๋ฐ์ดํฐ์์ ๊ณ๊ธ์ ๋ํ ๋น๋์๋ฅผ ๋ํ๋ผ ๋ ์ฌ์ฉํ๋ค.
์๋(skerness)
ํ์คํ ๊ทธ๋จ์ ๋น๋์นญ์ฑ์ ์ ๋๋ฅผ ๋ํ๋ด๋ ์ฒ๋
๊ผฌ๋ฆฌ๊ฐ ๊ธด ์ชฝ์ ์น์ฐ์ณ์ ํ์ ํ๋ฉด ๋๋ค. ๊ผฌ๋ฆฌ๊ฐ ์ค๋ฅธ์ชฝ์ด๋ผ๋ฉด ์์ ๋น๋์นญ, ๋ฐ๋๋ ์์ ๋น๋์นญ์ด๋ค.