Example of a Layer
- ์ด์ ์๋ ๋ฐฐ์ ๋ ์ ๊ฒฝ๋ง์ ๋ ธ๋์์ ํ๋ ํ๋์ผ๋ก ๋์์ค์.
- ๊ฒฐ๊ตญ ์ด ํํฐ๋ ๊ฐ์ค์น๋ค์ ๋ชจ์์ด๊ณ ,
- ์๋ ๋ฐ์ดํฐ์์ ์ด ๊ฐ์ค์น๋ฅผ ๊ณฑํ๋ค์์ ๋ํ๋ ํ์๋ ํ ๋ ธ๋์ ์ด ๋ฐ์ดํฐ๋ค์ด ๋ค์ด๊ฐ๋ ๊ฒ์ด๋ค.
- ํ๋์ ๋ ธ๋์ ์ฐ๊ฒฐ๋ ๋ง์ ๋ ธ๋๋ค์ ๊ฐ์ค์น๋ฅผ ๊ณฑํ๊ณ ๋ค ๋ํ๋ค์์ ์ฐ๋ฆฌ๋ ๋ญํ์์ง?
- Activation Function์๋ค๊ฐ ์ด ๊ฐ์ ๋ฃ๊ณ ์ถ๋ ฅ๊ฐ์ ์ป์๋ค.
- ์ด๊ฑธ ์๊ฐํ ํด๋ณด๋ฉด!
- ์ด๋ ๊ฒ ๋๋ค.
- ์๋ ๊ฐ๊ฐ์ ๋ ธ๋์ ๋ํด Bias ํญ์ด ์๊ธด๋ค๊ณ ์์๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ
- ๊ตฌํ์ ์ํด์๋ ์ถ๋ ฅ์ ๋ํด ๊ฐ์ Bias๋ฅผ ๋ํด์ฃผ๋ ๊ฒ์ด ํจ์จ์ ์ด๋ค.
- ์ด ์ฐ์ฐ์ ๊ฒฐ๊ณผ๋ก ์ฐ๋ฆฌ๋ 4 x 4 x 2 ๋ฅผ ์ป์ ์ ์๋ค.
- ๊ทธ๋ฆฌ๊ณ ์ด ๊ฒ์ด Convolution network์ ํ Layer๊ฐ ๋๋ค.
- ์ด๊ฑธ ํ๋ ฌ์ ํํ๋ก ์ ๋ฆฌํด ๋ณด๋ฉด,
๊ทธ๋ฆผ์ผ๋ก ๋ค์ํ๋ฒ ๋ณด์.
- ๊ฒฐ๊ตญ ์์ ์ฐ๊ฒฐ๊ณผ ๋ฌ๋ผ์ง ๊ฒ์ ๋ช๊ฐ ๋จ์๋ก ์ฐ๊ฒฐ์ ํ๋๋! ๋ง ๋ฌ๋ผ์ก๋ค.
Example
- ๋ง์ฝ 3 x 3 x 3 ํํฐ๊ฐ 10๊ฐ ์์ ๋, ํ๋ผ๋ฏธํ จ๋ ๋ช๊ฐ์ผ๊น?
- 1๊ฐ์ ํํฐ์ ๋ค์ด๊ฐ๋ ๋ณ์๊ฐ 27๊ฐ ์ด๊ณ , ์ด ํํฐ์ ์ ์ฉ๋๋ Bias๋ 1๊ฐ์ด๋ฏ๋ก
- 1๊ฐ์ ํํฐ๋น ์๊ธฐ๋ ๋ณ์๋ 28๊ฐ์ด๋ค.
- ์ด๊ฒ 10๊ฐ๊ฐ ์์ผ๋ฏ๋ก ์ฐ๋ฆฌ๊ฐ ์กฐ์ ํด์ค์ผํ๋ ํ๋ผ๋ฏธํฐ๋ ์ด 280๊ฐ ์ด๋ค.
- ์ด๊ฒ์ด ์ ์ฉํ ์ด์ ๋, ์์ ์ฐ๊ฒฐ๋ง์์ ์ฐ๋ฆฌ๋ ๋ ธ๋๊ฐ ๋ชจ๋ ์ฐ๊ฒฐ๋์ด ์๊ธฐ ๋๋ฌธ์,
- ์ ๋ ฅ ๋ณ์๊ฐ ๋ง๊ฒ ๋๋ฉด ํ๋ผ๋ฏธํฐ ์๋ ๊ธฐํ ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํ๋ค.
- ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์ด ํ๋ผ๋ฏธํฐ๋ค์ ์ต์ ๊ฐ์ ์ฐพ๊ธฐ๊ฐ ์ด๋ ค์ ๋๋ฐ,
- ์ด์ ๋ ธ๋์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ฉํ ๋, ์ ํ๋ ๋ฒ์์ ํ๋ผ๋ฏธํฐ๋ง ์ ์ฉํ๊ฒ ๋๋ฏ๋ก,
- ์ฆ ํํฐ์ ํฌ๊ธฐ๋ก ์ ํํ๊ฒ ๋๋ฏ๋ก, ์ด์ ๋ ์ ๋ ฅ๊ฐ์ด ์ปค์ง๋๋ผ๋ ํ๋ผ๋ฏธํฐ์ ๊ฐ์๊ฐ ์ฆ๊ฐํ์ฌ ์๊ธฐ๋
- ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ค.
- ์ฆ ์ ๋ฌธ์ ์์ ์ ๋ ฅ์ด 1000 x 1000 ํฝ์ ์ ์ด๋ฏธ์ง๊ฐ ๋ค์ด์ค๋๋ผ๋ ์ฌ์ ํ ๋ด๊ฐ ๊ฒ์ถํ๊ณ ์ถ์
- ํน์ฑ ํํฐ๋ 10๊ฐ ์ด๋ฏ๋ก, 280๊ฐ์ ํ๋ผ๋ฏธํฐ๋ง ์กฐ์ ํ์ฌ ์์ฑ์ ๊ฒ์ถํ ์ ์๋ค!
Notation
l ๋ฒ์งธ Convolution Layer์ ์์๋
<Input>\\ n_H^{\[l-1\]} \times n_W^{\[l-1\]}\times n_C^{\[l-1\]}\\ Because ;it ;is;value;of;the activation;of;previous;layer \\ we; use; l-1\\ And,\\ Input ;is;equal;to;a^{\[l-1\]}\\ So,\\ a^{\[l-1\]};=;n_H^{\[l-1\]} \times n_W^{\[l-1\]}\times n_C^{\[l-1\]}- a๋ ์ด์ ๊ณ์ธต์ ๋ ธ๋๋ค์ ํต์นญํด์ ์๊ธฐํ๋ค.
- ๊ฐ ํํฐ์ ์ฑ๋์์, ์ ์ฒด ์ฑ๋ ๊ฐ์๋ฅผ ์ ๋ณด์.
- ๊ฐ์ค์น ์ด ๊ฐ์์ ํํฐ์์ ๊ด๊ณ๋ ์ ๋ณด์.
- ์ฌ๊ธฐ์ ์ฃผ๋ชฉํด์ผ ํ๋ ๊ฒ์ ๊ฐ ํํฐ์ ์ฑ๋์ ์ด์ ํ์ฑ input์ ์ฑ๋๊ณผ ๊ฐ์์ผ ํ๋ค๋ ์ .
- ๊ทธ๋ฆฌ๊ณ ํํฐ์ ๊ฐ์๊ฐ output์ ์ฑ๋ ๊ฐ์๋ฅผ ๊ฒฐ์ ํ๋ค๋ ์ ์ด๋ค!
Example of Simple Convolutional Network
Construction
์ ์ฒด์ ์ธ ๊ตฌ์กฐ๋ ๋ค์๊ณผ ๊ฐ๋ค.
graph LR
A[X-input] --> |Conv1|B[Layer 1]
B --> |Conv2|C[Layer 2]
C --> |FullyConct|D[Layer 3]
D --> |SoftMax|E[Prediction]
๊ฒฐ๊ตญ Convolution Network์์ ์ฐ๋ฆฌ๊ฐ ์ค์ ์ ์ผ๋ก ์์ ๋ด์ผํ๋ ๊ฒ์, ์ด ๊ณผ์ ์ ์ํํ๋ ๋ฐ ์์ด ์ด๋ค Hyperparameter๋ฅผ ์ฐ๋๋์ด๋ค.
์ด๊ฒ์ด ๊ถ๊ทน์ ์ผ๋ก ๊ตฌ์กฐ๋ฅผ ๋ณํ์ํค๊ธฐ ๋๋ฌธ์ด๋ค.
๋ํ ์ด๋ ๊ฒ ์ฒ์ ์ด๋ฏธ์ง๋ RGB์ 3๊ฐ์ ์ฑ๋๋ง ๊ฐ์ง๊ณ ์์ง๋ง, Layer๊ฐ ์ฆ๊ฐํ๋ฉด์ Channel ์๊ฐ ์ฆ๊ฐํ๋ ์์์ ๋ณด์ธ๋ค.
์ง๊ด์ ์ผ๋ก๋ ์ฒ์์๋ ๊ฐ๋จํ ํ์ํน์ฑ(์์ง์ , ์ํ์ ) ๋ฑ๋ง ํ์ํ๋ค๊ฐ ์ด๊ฒ๋ค์ ์กฐํฉ์ผ๋ก ๋ง๋ค์ด์ง๋ ์๋ง์ ํน์ฑ๋ค์ด ์๊ฒ๋๋ฏ๋ก ์ ์ ๋ง์ ํํฐ(ํน์ฑ)๋ฅผ ์ฌ์ฉํ๋ ๋ฏํ๋ค.
What is Parameter, Hyperparameter
ํ๋ผ๋ฏธํฐ๋ ๊ฐ์ค์น๋ฅผ ์๊ธฐํ๋ค. ๊ทธ๋ฆฌ๊ณ ํ์ดํผํ๋ผ๋ฏธํฐ๋ ํํฐ์ ํฌ๊ธฐ, ์คํธ๋ผ์ด๋, ํจ๋ฉ๊ณผ ๊ฐ์ ๊ฐ์ ์๋ฏธํ๋ค.
์ฆ, ํ๋ผ๋ฏธํฐ๋, ์ฐ๋ฆฌ๊ฐ ๊ถ๊ทน์ ์ผ๋ก ๊ตฌํ๊ณ ์ถ์ ๋ณ์๋ฅผ ์๋ฏธํ๊ณ , ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ ๊ทธ ๊ณผ์ ์์์ ํ์ํ ๋ณ์๋ค์ ์๋ฏธํ๋ค.
ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ์์๋ก๋ Gradient Deacent ์ learning rate๊ฐ ์๊ฒ ๋ค.