Overfitting?
Train data set์์๋ accuracy๊ฐ ๋๊ฒ ๋์ค์ง๋ง,
Test data set์์ accuracy๊ฐ ๋ฎ๊ฒ ๋์ค๋ ํ์
Layer์๊ฐ ๋์ด๋ ์๋ก training err๋ ๋จ์ด์ง๋ค.
๊ทธ๋ฐ๋ฐ test ๋ฐ์ดํฐ๋ฅผ ๋ฃ์์ ๊ฒฝ์ฐ err๊ฐ ์ฌ๋ผ๊ฐ๋ค.
Solutions for overfitting
- ํ๋ จ๋ฐ์ดํฐ๋ฅผ ๋ ๊ตฌํ๋ค.
- Feature๋ฅผ ์ค์ธ๋ค(Machine Learning algorithm)
- Regularization(Weight)
Regularization
Weight๊ฐ ๋๋ฌด ๋ค์ญ๋ ์ญํด์ง๋, ์ฆ overfitting์ด ์ผ์ด๋๋ ๊ฒ์ ๊ท์ ํ๋ ๊ฒ.
๊ฐ์ด ์๋์ ์ผ๋ก ๊ณ ๋ฅด๊ฒ ๋ถํฌํ๋๋ก w๋ฅผ ๋ง๋๋ ๊ฒ์ด overfitting์ ๋ฐฉ์งํ๋ ๋ฐฉ๋ฒ์ด๋ค.
Regularization (mathematics) - Wikipedia
Dropout
์์ ์ฐ๊ฒฐ๋ง์ผ๋ก๋ถํฐ ๋์ด๋ฒ๋ฆฌ์!
๊ฐ๊ฐ์ ๋ด๋ฐ์ ํน์ ๋ถ๋ถ์ ๋ด๋นํ๋ ์ ๋ฌธ๊ฐ๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋๋ฐ,
์ด๊ฑธ ๋ชจ๋ ํ์ต์ํค๋ ๊ฒ๋ณด๋ค, ์ค๊ฐ ์ค๊ฐ ๋์ ๋ค ํ์ตํ๋ ๊ฒ์ด ๋ณด๋ค ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค.
ํ์ตํ ๋๋ง! dropout์ ์ฌ์ฉํ๋ค.
ํ ์คํธ ์์๋ ๋ชจ๋ ์ ๋ฌธ๊ฐ๋ฅผ ๋ถ๋ฌ์์ ํ๊ฐํ๋ค!
ํ๊ฐ ์์๋ dropout = 1๋ก ํ๋ค.
Ensemble
๋ ๋ฆฝ์ ์ธ ๋ชจ๋ธ n๊ฐ์ ๊ฒฐ๊ณผ๋ฌผ์ ์งํฉํ์ฌ ์ต์ข ๊ฒฐ๊ณผ๋ฌผ์ ์ ์ถํ๋ค!