๋น์ฉ ์ต์ํ ์ฝ๋
์ ๋ฒ๊ธ์์ X, Y์ ์ต์ ํ๋ W, b๋ฅผ ์ฐพ์๋ค๋ฉด, ์ด๋ฒ์๋ ๊ณ ์ ๋ X, Y ์ ๋ํด ๋ค๋ฅธ W๊ฐ์ ๋ฃ์ด์ฃผ๋ฉด์ Cost์ ๋ณํ๋ฅผ ์ดํด๋ณด์.
W = 1 ์ผ๋, cost๊ฐ ์ต์๊ฐ ๋๋ค.
Gradient Descent
W=Wโฮฑm1โโ_i=1m(Wx(i)โy(i))x(i)
W๋ฅผ ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์
๋ฐ์ดํธํ๋ ๊ฒ์ด W์ ์ต์๋ฅผ ์ฐพ๋๋ก ํ๋ค.
์๊น minimize ํ ๋ ์ฌ์ฉํ๋ ์ฝ๋๋ฅผ ์ฐ๋ฆฌ๊ฐ ๋ค์์ ์ฝ๋๋ก ๋ฐ๊ฟ ์ ์๋ค.
๊ทธ๋ฆฌ๊ณ ๋์ ์ธ์
์ ์คํํด์ค์ผ ํ๋ฏ๋ก,
์ด๊ธฐ Weight๋ฅผ ๋ค๋ฅด๊ฒ ์ค๋ณด์.
Tensorflow์๊ฒ Gradient ๊ตฌํ๊ฒ ํด๋ณด๊ธฐ
์์ ์์ ์์ ์ฐ๋ฆฌ๋
MSE=m1โโ_i=1m(Wx(i)โy(i))2
MSE ํจ์์ Gradient ๋ฅผ ๊ตฌํด, gradient๋ผ๋ ๋ณ์์ ๋ฃ์ด์ฃผ์๋ค.
diff(MSE)=m2โโ_i=1m(Wx(i)โy(i))x(i)
๊ทธ๋ฐ๋ฐ, MSE๋ง ์ ์ํด์ฃผ๊ณ , tensorflowํํ
์ด๊ฑธ ์ํฌ ์ ์๋ค.
๋ํ ๋ฏธ๋ถ๊น์ง๋ง ์ ์ํ๊ณ , ๊ทธ ๊ฐ์์ ๋ด๊ฐ ์ถ๊ฐ์ ์ธ ํ๋ ์ญ์ ํ ์ ์๋ค.