์ด๊ธฐ๊ฐ ์ฃผ๊ธฐ
x, w = 0 ์ผ ๊ฒฝ์ฐ gradient๊ฐ 0์ด ๋์ ํ์ต์ด ์๋๋ค!
๋ชจ๋ 0์ด๋ฉด ํ์ต์ด ์๋๋ค!
Restricted Boatman Machine(RBM)
์ด๋ป๊ฒ Weight๋ฅผ ์ด๊ธฐํ ํ ์ ์์๊น?
๊ทธ ํด๊ฒฐ๋ฐฉ์ ์ค ํ๋๊ฐ RBM์ด์๋๋ฐ, ์์ด๋์ด๋ ๊ฐ๋จํ๋ค.
๋ด๋ด ๋คํธ์ํฌ๊ฐ ๋ง๋ค์ด์ ธ ์๋ค๊ณ ๊ฐ์ ํ์. ์ ๋ ฅ๋จ์ 3๊ฐ, ์ถ๋ ฅ์ 4๊ฐ. ์ฐ๋ฆฌ๊ฐ ์ด ๋ด๋ด ๋คํธ์ํฌ๋ฅผ ํ์ตํ ๋, ๊ฒฐ๊ตญ ํฌ๊ฒ ๋๊ฐ์ ๊ณผ์ ์ ์ํํ๊ฒ ๋๋๋ฐ,
Forward Propagation, Backward Propagation ์ด๋ค.
๊ทธ๋์ ์ฐ๋ฆฌ๋ ์ด๋ค ๊ฒฐ๊ณผ๋ฅผ ์ํ๋๋ฉด, ์ ๋ ฅ ์ ํธ์ ์ถ๋ ฅ ์ ํธ๊ฐ ๊ฐ์์ง๋ weight, bias๋ฅผ ๊ตฌํ๋ค.
์ด ๋ weight, bias๋ฅผ ์ด๊ธฐ๊ฐ์ผ๋ก ์ฌ์ฉํ๊ฒ ๋ค๋ ๊ฒ์ด RBM์ด๋ค.
RBM ๊ณผ์
Pre-training
์ ์ฒด ๋คํธ์ํฌ๋ฅผ ์ด๊ธฐํํ๋๋ฐ ์์ด์,
2๊ฐ์ Layer๋ง RBM์ ์ ์ฉํ๋ค. ์์ฐจ์ ์ผ๋ก 2๊ฐ์ฉ ํ๋ํ weight๊ฐ ์ด๊ธฐํํ weight์ด๋ค.
Xavier initialization
๊ทธ๋ ๊ฒ ์ํด๋ ๋ผ!
๋๋ฌด ์๊ฑฐ๋, ๋๋ฌด ํฌ๊ฒ๋ง ์ค์ ์ํ๋ฉด ๋ ๊ฑฐ์ผ.
์ ๋ ฅ ๊ฐ์ = fan_in, ์ถ๋ ฅ ๊ฐ์ = fan_out
He initialization
์ด๊ฑฐ ์๋๋๋ฐ..?