ํผํฉ ๋ถํฌ
ํน์ ๋ถํฌ๋ฅผ ๋ง๋๋๋ฐ ์์ด, ์ฌ๋ฌ๊ฐ์ ํ๋ฅ ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ.
- ์ํฉ์ ํ๋ ์๊ฐํด๋ณด์.
- 1์์ 6๊น์ง์ ์ซ์๊ฐ ๋์ด๋์ด ์๋ ๋ถํฌ๋ฅผ ์๊ฐํด๋ณด์.
- ํด๋น ์ซ์๋ค์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋น๋๋ฅผ ๊ฐ๊ณ ์์ ๊ฒ์ด๋ค.
- ๊ทธ๋ฆฌ๊ณ ์ฃผ์ฌ์ ํ๋๋ฅผ ์๊ฐํด๋ณด์.
- ์ ์ํฉ์์, ์ฃผ์ฌ์ ํ๋๋ฅผ ๋ฝ์์ ๋, ํน์ x(1~6)์ด ๋์ฌ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ตฌํด๋ณด์.
- ์ฌ๊ธฐ์ ๋ Categorical Distribution์์์ ๋จ์ผ ์ํ์ ์๋ฏธํ๋ค.
- ๋ ์ผ ๋, ๊ฐ ๋์ฌ ํ๋ฅ ์ ์๋ฏธํ๋ค.
๊ฒฝํ ๋ถํฌ์์์ ์์
- ์ฐ๋ฆฌ๋ ์ฌ์ค ํผํฉ๋ถํฌ๋ฅผ ๋ณธ์ ์ด ์๋ค.
- Empirical Distribution์ ์๊ฐํด๋ณด์.
- ๊ฒฝํ ๋ถํฌ๋ ์ํ ๋ง๋ค ํ๋์ ๋๋ ์ฑ๋ถ์ด ์๋ ํผํฉ ๋ถํฌ์ด๋ค.
Latent Variable
์ง์ ์ธก์ ํ ์ ์๋ ํ๋ฅ ๋ณ์
- ์๋ฅผ ๋ค์ด, ์ฌ๋๋ค์ ์ํ ์ฑ์ ์ ์ํฅ์ ๋ฏธ์น๋ ์์ธ์ผ๋ก โ์ง๋ฅโ์ด๋ผ๋ ์ ์ฌ ๋ณ์๋ฅผ ์๊ฐํด๋ณด์.
- โ์ง๋ฅโ์ ์ง์ ์ ์ผ๋ก ์ธก์ ํ ์ ์์ง๋ง, ์ํ ์ฑ์ ์ด๋ ๊ณต๋ถ ์๊ฐ ๋ฑ๊ณผ ๊ฐ์ ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ฐ์ ์ ์ผ๋ก ์ถ๋ก ํ ์ ์๋ค.
- ์ด๋ฌํ ์ ์ฌ ๋ณ์๋ ์ค์ ๋ด๊ฐ ๋ฐ๋ผ๋ณด๋ ์ฌ๊ฑด ์ ์ฐ๊ด๋ ์๋ ์๋ค.
- ์ด๋ฐ ๊ฒฝ์ฐ ์ ์ฌ ๋ณ์๋ฅผ ๋ผ ํ์ ๋, ๋ก ํํํ ์ ์๋ค.
Gaussian Mixture Model
๋ํ์ ์ธ ํผํฉ ๋ชจ๋ธ ์ค ํ๋๋ก, ์ ์ฌ ๋ณ์๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํ๋ ๊ฐ๋ ฅํ ๋ชจ๋ธ.
- ๊ฐ์ฐ์์ ํผํฉ ๋ชจํ(GMM)์ ์ ์ฌ ๋ณ์๋ฅผ ์ฌ์ฉํ ๋ํ์ ์ธ ๋ชจ๋ธ์ด๋ค.
- GMM์ ๊ฐ ๋ฐ์ดํฐ๊ฐ ์ฌ๋ฌ ๊ฐ์ ๊ฐ์ฐ์์ ๋ถํฌ ์ค ํ๋์์ ์์ฑ๋๋ค๊ณ ๊ฐ์ ํ๋ค.
- ์ฆ, ๊ฐ ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ถํฌ์์ ์์ฑ๋์๋์ง ์ง์ ์ ์ ์์ผ๋ฏ๋ก, ์ ์ฌ ๋ณ์๋ฅผ ๋์ ํ์ฌ ์ด๋ฅผ ์ค๋ช ํ๋ค.
- EM ์๊ณ ๋ฆฌ์ฆ(Expectation-Maximization)์ ํตํด ์ ์ฌ ๋ณ์๋ฅผ ์ถ์ ํ๊ณ , ๊ทธ์ ๋ฐ๋ผ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ๋ ๊ฐ์ฐ์์ ๋ถํฌ์ ํ๋ผ๋ฏธํฐ(ํ๊ท ์ ๊ณต๋ถ์ฐ )๋ฅผ ํ์ตํ๋ค.
- GMM์์ ๋ ์ฑ๋ถ i์์์ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ๋ํ๋ด๋ฉฐ, ๊ฐ๊ฐ์ ์ฑ๋ถ์ ํ๊ท ๊ณผ ๊ณต๋ถ์ฐ (, )์ผ๋ก ํ๋ผ๋ฏธํฐํ๋๋ค.
- ์ฑ๋ถ ๊ฐ์ ๊ณต๋ถ์ฐ์ด ๊ฐ๊ฑฐ๋ ๋ค๋ฅผ ์ ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ์ ์ฝ์ ์ค ์๋ ์๋ค.
Prior Probability
- ํ๊ท ๊ณผ ๊ณต๋ถ์ฐ ์ธ์, ๊ฐ์ฐ์ค ํผํฉ ๋ชจ๋ธ์ ๋งค๊ฐ๋ณ์๋ค์ ๊ฐ ์ฑ๋ถ ์ ๋ํด ์ฌ์ ํ๋ฅ ์ ๋ถ์ฌํ๋ค.
- ์ฌ๊ธฐ์ ์ฌ์ ์ด๋ ์ด ํ๋ฅ ์ด ๋ฅผ ๊ด์ธกํ๊ธฐ ์ด์ ์ ์ ๋ํ ๋ชจํ์ ํ์ ๋๋ฅผ ๋ํ๋ธ๋ค.
Posterior Probability
- ์ฌํ ํ๋ฅ ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ ๊ฐ ํน์ ์ฑ๋ถ ์ ์ํ ํ๋ฅ ์ด๋ค.
- ์ด๋ ๋ฐ์ดํฐ๋ฅผ ๊ด์ฐฐํ ์ดํ ๋ชจ๋ธ์ด ํน์ ์ฑ๋ถ์ ๋ํด ๊ฐ์ง๋ ํ์ ๋๋ฅผ ๋ํ๋ธ๋ค.
- ์ด๊ฑด ์ต์ข ์ ์ผ๋ก GMM์์ ์ฌ์ฉํ ๋ถํฌ๋ฅผ ๊ฒฐ์ ์ง๋ EM ์๊ณ ๋ฆฌ์ฆ์์ ๊ฐ๋ฅ๋๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํด ์ฌ์ฉํ๋ค. ๊ทธ๋ฅ ์ผ๋จ ์์๋ง ๋์.
- GMM์ ์ค์ํ ์์ฑ ์ค ํ๋๋ ์ถฉ๋ถํ ๋ง์ ๊ฐ์ฐ์์ ์ฑ๋ถ์ ์ฌ์ฉํ๋ฉด ์์์ ๋งค๋๋ฌ์ด ํ๋ฅ ๋ฐ๋ ํจ์๋ฅผ ๋งค์ฐ ์ ํํ๊ฒ ๊ทผ์ฌํ ์ ์๋ค๋ ์ ์ด๋ค.
- ์ฆ, ๋ณต์กํ ๋ถํฌ๋ผ๋ ์ฌ๋ฌ ๊ฐ์ฐ์์ ๋ถํฌ์ ํผํฉ์ผ๋ก ๊ฑฐ์ ์๋ฒฝํ๊ฒ ํํํ ์ ์๋ค.
- ๊ฐ์ฐ์์ ์ฑ๋ถ์ ์๋ฅผ ๋๋ฆฌ๊ณ ์กฐ์ ํ๋ฉด, ์ค์ ๋ฐ์ดํฐ ๋ถํฌ์ ๊ฐ์ฐ์์ ํผํฉ ๋ชจํ์ด ํํํ๋ ๋ถํฌ ๊ฐ์ ์ฐจ์ด๋ฅผ ์ต์ํํ ์ ์๋ค.
- ์ด๋ฌํ ํน์ฑ ๋๋ถ์ GMM์ **๋ณดํธ์ ๊ทผ์ฌ๊ธฐ(Universal Approximator)**๋ก ๋ถ๋ฆฐ๋ค.
์ ๋ฆฌ
- ํผํฉ ๋ถํฌ๋ ์ฌ๋ฌ ๊ฐ์ ๊ฐ๋ณ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ฒฐํฉํ์ฌ ํ๋์ ๋ณต์กํ ๋ถํฌ๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ด๋ค.
- **Latent variable(์ ์ฌ ๋ณ์)**์ ์ง์ ๊ด์ฐฐํ ์ ์์ง๋ง ๋ฐ์ดํฐ ์์ฑ์ ์ํฅ์ ๋ฏธ์น๋ ์จ๊ฒจ์ง ํ๋ฅ ๋ณ์๋ฅผ ์๋ฏธํ๋ค.
- ์ด๋ ํน์ ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ถํฌ์์ ์์ฑ๋์๋์ง ๋ชจ๋ฅด๋ ์ํฉ์ ๋ฐ์ํ๋๋ฐ, ์๋ฅผ ๋ค์ด ์ฐ๋ฆฌ๊ฐ ๊ด์ฐฐํ๋ ๋ฐ์ดํฐ๊ฐ ์ด๋ค ์ ์ฌ์ ์ธ ๋ฉ์ปค๋์ฆ์ ์ํด ๋์๋์ง ์ ์ ์๋ ๊ฒฝ์ฐ์ด๋ค.
- ๋๋ถ๋ถ์ ์ค์ ๋ฐ์ดํฐ๋ ์ด๋ฌํ ์ ์ฌ ๋ณ์๋ฅผ ํฌํจํ ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์, ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ํด๋น ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ถํฌ์์ ์์ฑ๋์๋์ง ์ ์ ์๋ค.
- ํ์ง๋ง ์ฐ๋ฆฌ๋ ์ ์ฌ ๋ณ์๋ฅผ ๊ฐ์ ํ๊ณ , ์ด๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํ ์ ์๋ ๋ชจ๋ธ์ ๋ง๋ค์ด์ผ ํ๋ค.
- ์ง๊ด์ ์ธ ์ ๊ทผ๋ฒ์, ์ ์ฌ ๋ณ์๊ฐ ์๋ค๊ณ ๊ฐ์ ํ ํ ๋ชจ๋ธ์ด ๋ฐ์ดํฐ์ ๊ฐ์ฅ ์ ํฉํ๊ฒ ์๋ํ๋๋ก ํ์ต์ํค๋ ๊ฒ์ด๋ค.
- EM ์๊ณ ๋ฆฌ์ฆ์ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก, ์ ์ฌ ๋ณ์๋ฅผ ๊ณ ๋ คํ ์ํ์์ ๋ฐ์ดํฐ๊ฐ ๊ฐ์ฅ ์ ์ค๋ช ๋๋๋ก ๊ฐ๋ฅ๋(์ฐ๋, Likelihood)๋ฅผ ์ต๋๋ก ํ๋ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋๋ค.
- EM ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฐ๊ณผ๋ก ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ ํน์ ์ ์ฌ ๋ณ์์ ์ํ ํ๋ฅ ์ ์ถ์ ํ๋ฉฐ, ์ด ์ ์ฌ ๋ณ์๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ํ๋ธ๋ค๊ณ ๊ฐ์ ํ๋ค.
- **๊ฐ์ฐ์์ ํผํฉ ๋ชจํ(GMM)**์ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๊ฐ์ ๊ฐ์ฐ์์ ๋ถํฌ์ ํผํฉ์ผ๋ก ์ค๋ช ํ๋ ๋ชจ๋ธ๋ก, EM ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๊ฐ ๋ฐ์ดํฐ๊ฐ ์ด๋ ๊ฐ์ฐ์์ ๋ถํฌ์์ ๋์๋์ง ํ๋ฅ ์ ์ผ๋ก ์ถ์ ํ๋ค.