What is Padding Convolution
-
์ ๊ฒ์๋ฌผ์์ 3x3 ์ง๋ฆฌ ํํฐ๋ฅผ ๊ฑธ์์ ๋, 4x4์ง๋ฆฌ๊ฐ ๋์๋ค.
-
์ด๋ป๊ฒ ๋ณด๋ฉด ๋น์ฐํ ๊ฒฐ๊ณผ์ด๋ค.
-
์ด๋ฏธ์ง์ ํ ๋ณ์ ํฌ๊ธฐ๋ฅผ n, ํํฐ์ ํ ๋ณ์ ํฌ๊ธฐ๋ฅผ f๋ผ๊ณ ํ๋ค๋ฉด,
-
์ถ๋ ฅ์ ํ ๋ณ์ ํฌ๊ธฐ๋,
(nโ โโ fโ +โ 1)โ รโ (nโ โโ fโ +โ 1)
-
๊ทธ๋ฐ๋ฐ ์ด๋ ๊ฒ ๋๋ค๋ฉด, ์ ๊ทธ๋ฆผ์์ 6x6 ์ง๋ฆฌ ํ๋ ฌ์ ๊ฐ์ฅ์๋ฆฌ์ ์๋ ํฝ์ ๋ค์
-
์ค๊ฐ์ ์๋ ํฝ์ ๋ณด๋ค ์ ์ ํ์๋ก ํํฐ๊ฐ ๊ฑธ๋ฆฐ๋ค.
-
์ฆ ๋ฐ์ดํฐ์ ์์ค์ด ์๊ธด๋ค.
-
๋๋ฒ์งธ๋ก๋ ์ด๋ฏธ์ง๊ฐ ์ถ์ ๋๋ค๋ ๋จ์ ์ด ์๋ค.
- ๋ด๊ฐ ์ํ๋ ์ด๋ฐ ๊ฒฐ๊ณผ๊ฐ ๋์ค๊ธฐ ์ํด์๋ ์ด๋ค ์กฐ์น๋ฅผ ์ทจํด์ค์ผํ๋ค.
- ๋ค์๊ณผ ๊ฐ์ด 6x6 ์ฃผ๋ณ์ 1์ง๋ฆฌ ํ ๋๋ฆฌ๋ ๋ง๋ฐ์ด (PAD) ์ฃผ๋ฉด, ํด๊ฒฐ๋๋ค!
- ์ด๋ ๊ฒ ๋ ๋ ๋ฐ์ดํฐ ์์ค, ์ด๋ฏธ์ง์ถ์์ ๋๊ฐ์ง ๋จ์ ์ ๋ชจ๋ ์ก์ ์ ์๋ค.
- ํจ๋ฉํด์ฃผ๋ ๊ฐ์ 0์ผ๋ก ๋ณดํต ์ฑ์ด๋ค.
- ๋ด๊ฐ p๋ฅผ ํจ๋ฉ์ ์์ด๋ผ๊ณ ํ๋ฉด ์ด๋ p = 1์ด๋ค.
- ์ด์ ํจ๋ฉ๊น์ง ์ถ๊ฐํ์ฌ ๊ฒฐ๊ณผ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ์์ํด๋ณด๋ฉด, (nโ +โ 2pโ โโ fโ +โ 1)โ รโ (nโ +โ 2pโ โโ fโ +โ 1)
Category of Padding
- Vaild
- No Padding
- p = 0
- Same
- ๋ฐฉ๊ธ๊ฐ์ 3x3 ํํฐ์ ๊ฒฝ์ฐ p = 1 ์ผ ๋ ์ถ๋ ฅ๊ฐ๊ณผ ์ ๋ ฅ๊ฐ์ ํฌ๊ธฐ๊ฐ ๋์ผํจ
- ๊ฒฐ๋ก ์ ์ผ๋ก ์ ๋ ฅ๊ณผ ๊ฐ์ ํฌ๊ธฐ์ ์ถ๋ ฅ์ ๊ฐ๊ฒํ๋ ํจ๋ฉ๊ฐ
๊ฑฐ์ ํญ์ ํํฐ๋ ํ์์ ํฌ๊ธฐ๋ฅผ ๊ฐ๊ณ ์๊ธฐ ๋๋ฌธ์ Padding์ ์ ์๊ฐ์ผ๋ก ๋จ์ด์ง๋ค.
What is Strided Convolution
- ์ง๊ธ๊น์ง ํํฐ๋ฅผ ๊ณฑํ ๋ ํ์นธ์ฉ ๋๋ฉด์ ๊ณฑํ๋๋ฐ,
- ๋์นธ์ฉ ๋์ด์ ์ฐ์ฐํ์!
- ์ด๊ฒ ์คํธ๋ผ์ด๋์ ๊ฐ๋ ์ด๋ค.
- ์ด๊ฑธ ๊ธฐ์กด์ Fully connected Neural Network๋ก ๋ณธ๋ค๋ฉด,
- ์ ๊ฒฝ๋ง์ด ์ฐ๊ฒฐ๋ ๋ ์์ด์, ๊ณต์ฐจ๋ฅผ ๋ช์ผ๋ก ๋๊ฒ ๋๋ ์๋ฏธ์ ์๋ฑํ๋ค.
- ์ ๊ทธ๋ ๋ค๋ฉด ์ด ๊ฒฝ์ฐ, Stride ๋ 2์ด๋ค.
- ์ด ๊ฒฝ์ฐ ์ถ๋ ฅ๊ฐ์ 3x3 ์ด๊ณ , ์ด ๊ด๊ณ๋ฅผ ๋ํ๋ด์ด ๋ณด๋ฉด,
- ์ด ๋, ์ ์๊ฐ ์๋๋ฉด ๋ด๋ฆผ์ ํด์ค๋ค.
Convolutions in RGB Channels
- ์ด์ ๋ฐ๊ธฐ๋ง ์๊ฐํ ์ด๋ฏธ์ง๋ก ๋ถํฐ, ์ค์ ์์ ๋ํ๋ด๋ RGB๋ก ํ์ฅํด์ ์๊ฐํด๋ณด์.
- ์ด์ ์ด๋ฐ์์ผ๋ก 3๊ฐ์ RGB ์ฑ๋์ ๋ํด 3๊ฐ์ ํํฐ๋ฅผ ์ฌ์ฉํด์ ๊ฐ์ ๋ฐ์ ๊ฒ์ด๋ค.
- ๊ทธ๋ฐ๋ฐ ํ๊ฐ์ง ์ฃผ๋ชฉํด์ผ ํ๋ ์ ์ ์ด๋ฏธ์ง์ ์ฑ๋ ์์ ํํฐ์ ์ฑ๋ ์๋ ๊ฐ์์ผ ํ๋ค๋ ์ ์ด๋ค.
- ํ์ง๋ง ์ถ๋ ฅ๊ฐ์ ์ฑ๋์๋ ๊ฐ์ ํ์๊ฐ ์๋ค.
- ์์ ๊ทธ๋ฆผ์ ์กฐ๊ธ๋ ๊ฐ๋จํ๊ฒ ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
- ์ด ๋, 3 x 3 x 3์ ํํฐ๋ฅผ ์ ์ก๋ฉด์ฒด ๋ฉ์ด๋ฆฌ๋ก ๋ณธ๋ค๋ฉด,
- ์ด์ ์ด ๋ฉ์ด๋ฆฌ๊ฐ RGB ์ฑ๋๋ก ๊ตฌ์ฑ๋ ์ด๋ฏธ์ง์ ํ๋ฒ์ฉ ์ ์ฉ๋๋ ํํ์ด๋ค.
- ๊ทธ๋ ๋ค๋ฉด ํํฐ์ ์์๋ ์ด 9๊ฐ๋ก ๊ตฌ์ฑ๋ ํ ์๋ฉ์ด๋ฆฌ ์ด๋ฉฐ, ์ด๋ฏธ์ง์ ์ ์ฉ์ด ๋๋ฉด ์ด 27๊ฐ์ ๊ฐ์ด ๋์จ๋ค.
- ๊ทธ๋ฐ๋ฐ ์ฐ๋ฆฌ๋ Convolution ์ฐ์ฐ์ ํ๋ฏ๋ก ์ด 27๊ฐ์ ๊ฐ์ ๋ค ๋ํ ๊ฒ์ด
- ์ถ๋ ฅ์ [1,1]์ ์ ์ฅ๋๋ค.
- ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ 4 x 4 x 3 ์ด ์๋ 4 x 4 x 1์ง๋ฆฌ ์ถ๋ ฅ์ ์ป๊ฒ ๋๋ค.
์ฐธ๊ณ
- ํ ์ํ๋ก์ฐ์์ ์ ๋ ธ๋์ ์ฐ๊ฒฐ์ด ํ ์๋ก ์ด๋ฃจ์ด์ง๋ค๊ณ ํ๋์ง ์ ์์์์ ๋ณด๋ค ํ์คํ๊ฒ ์ ์ ์๋ค.
- ์ฌ๊ธฐ์ ํํฐ๋ ๊ฐ์ค์น ๋ฉ์ด๋ฆฌ์ด๊ธฐ ๋๋ฌธ์ด๋ค.
- ๊ทธ๋ฆฌ๊ณ ์ผ์ชฝ์ ์ด๋ฏธ์ง๋ Input data๋ฅผ ๋ด๊ณ ์๋ ๊ฐ๊ฐ์ ๋ ธ๋์ด๋ค.
- ํ ์๋ก ๊ตฌ์ฑ๋์ด ์๋ ๊ฐ์ค์น ๋ฉ์ด๋ฆฌ๋ฅผ ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ ํด์ฃผ๊ณ ๊ทธ ๊ฐ์ ๋ค์ ๋ ธ๋๋ก ๋๊ฒจ์ฃผ๊ณ ์๋ค.
- Input data ์ญ์ ํ ์๋ก ๊ตฌ์ฑ๋์ด ์๊ณ ์ด๊ฒ์ ๋๊ฒจ์ฃผ๋ ๊ฒ๋ ๊ฒฐ๊ตญ ํ ์๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
- ๊ฒฐ๊ณผ์ ์ผ๋ก ํ ์์ ํ๋ฆ์ผ๋ก ๋ฌด์ธ๊ฐ๋ฅผ ๋ง๋ค๊ณ ์๊ธฐ ๋๋ฌธ์ TensorFlow ์ด๋ค.
- ์ ์ฌ๊ธฐ์ ๋ง์ฝ์ ๋นจ๊ฐ์์ ์์ง ์ค๊ณฝ์ ๋ง ๋ผ์ค๊ณ ์ถ๋ค๋ฉด ํํฐ๋,
- ์ ๊ฐ์ด ํํ ๊ฐ๋ฅํ๋ค.
- ๊ทธ๋ฐ๋ฐ ๋ง์ฝ ์์ง์ ๊ณผ ์ํ์ ์ ๋์์ ๋ฐ์ค๊ณ ์ถ์ผ๋ฉด ์ด๋ป๊ฒ ํ ๊น?
- ๋ค์๊ณผ ๊ฐ์ ์ํฉ์์,
- ๋ ธ๋์ = Vertical
- ์ฃผํฉ์น = Horizontal ํํฐ๋ผ๊ณ ํด๋ณด์.
- ์ด ๊ฒฝ์ฐ ๋์จ ์ถ๋ ฅ์ 4 x 4 ๊ฐ 2๊ฐ๊ฐ ๋์ฌ ๊ฒ์ด๋ค.
- ์ด ๋๊ฐ๋ฅผ ๋ด๊ฐ ํ๊บผ๋ฒ์ ์ด๋ค๋ฉด, 4 x 4 x 2 ์ด๋ค.
- ๋ด๊ฐ RGB ์ฑ๋์ ๊ฐ๊ฐ ๋ค์ด๊ฐ๋ ํํฐ๋ฅผ ์ด๋ค ํ๋์ ๋จ์์ฒ๋ผ ๋ณธ๋ค๋ฉด,
- ๋ค์ ๋งํด์ ์ ๊ทธ๋ฆผ์์ ๋ ธ๋์ ํํฐ, ์ฃผํฉ์ ํํฐ์ ๊ฐ์ด 2๊ฐ์ ํํฐ๊ฐ ์๋ค๊ณ ์๊ฐํ๋ค๋ฉด,
- ์ถ๋ ฅ์ ์ฑ๋ ์๋, ๋ด๊ฐ ์ฌ์ฉํ ํํฐ์ ๊ฐ์์ ๋ฐ๋ผ ๊ฒฐ์ ๋๋ค.
- ์ฌ๊ธฐ์ ํต์ฌ์ ์ธ ๊ฒ์,
- ๋ด๊ฐ ํ์ํ ํํฐ๋ค์ ์ด๋ฏธ์ง์ ๋ค ๊ฑธ์ด๋ฒ๋ฆฐ ํ
- ์ด๊ฒ๋ค์ ํ๋ฐ๋ชจ์ ๋ค๊ฐ์ด ํ๊ฐํ ์ ์๋ค๋ ๊ฒ์ด๋ค!
- ์ฆ ๊ฒ์ถํ๊ณ ์ ํ๋ ํน์ฑ์ ์๋งํผ ์ถ๋ ฅ์ ์ฑ๋์ ๊ฐ๊ฒ ๋๋ค!