์ธ ํ•จ์ˆ˜ ์— ๋Œ€ํ•œ ์ด์ฐจ๋ฏธ๋ถ„์„ ๋ชจ์•„๋†“์€ ํ–‰๋ ฌ

์ •์˜

  • (์Šค์นผ๋ผ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํ•จ์ˆ˜์— ๋Œ€ํ•˜์—ฌ)

๋‹ค๋ฅธ ํ‘œํ˜„

  • ํ—ค์„ธ ํ–‰๋ ฌ์€ ๊ธฐ์šธ๊ธฐ์˜ ์•ผ์ฝ”๋น„ ํ–‰๋ ฌ์ด๋‹ค.

  • ๊ธฐ์šธ๊ธฐ(Gradient): ๊ฐ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ์ผ์ฐจ ํŽธ๋ฏธ๋ถ„์„ ๋ฒกํ„ฐ๋กœ ๋ชจ์€ ๊ฒƒ

  • ๊ธฐ์šธ๊ธฐ์˜ ์•ผ์ฝ”๋น„ ํ–‰๋ ฌ

    • ๊ธฐ์šธ๊ธฐ ์ž์ฒด๊ฐ€ ๋ฒกํ„ฐ์ด๋ฏ€๋กœ, ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ฐ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ๋‹ค์‹œ ํŽธ๋ฏธ๋ถ„ํ•˜๋ฉด ๊ฒฐ๊ณผ์ ์œผ๋กœ ์•ผ์ฝ”๋น„ ํ–‰๋ ฌ์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.
    • ์ฆ‰, ๊ธฐ์šธ๊ธฐ์˜ ๊ฐ ์„ฑ๋ถ„์„ ํ•œ ๋ฒˆ ๋” ๋ฏธ๋ถ„ํ•˜๋ฉด ์ด์ฐจ ๋ฏธ๋ถ„ ์ •๋ณด๊ฐ€ ๋ชจ์ธ ํ—ค์„ธ ํ–‰๋ ฌ์ด ๋œ๋‹ค.
  • ํ—ค์„ธ ํ–‰๋ ฌ์˜ ์ •์˜

    • ์Šค์นผ๋ผ ํ•จ์ˆ˜ย  ์˜ ํ—ค์„ธ ํ–‰๋ ฌ์€ ๊ฐ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ์ด์ฐจ ํŽธ๋ฏธ๋ถ„์„ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ •๋ฆฌํ•œ ํ–‰๋ ฌ์ด๋‹ค.
    • ๊ธฐ์šธ๊ธฐ์˜ ๊ฐ ์„ฑ๋ถ„์— ๋Œ€ํ•ด ํ•œ ๋ฒˆ ๋” ํŽธ๋ฏธ๋ถ„ํ•œ ๊ฒƒ์ด๋ฏ€๋กœ, ์‹ค์ œ๋กœ๋Š” ๊ธฐ์šธ๊ธฐ ๋ฒกํ„ฐ์— ๋Œ€ํ•œ ์•ผ์ฝ”๋น„ ํ–‰๋ ฌ๊ณผ ๊ฐ™๋‹ค.

ํŠน์ง•

  • ํ—ค์„ธ ํ–‰๋ ฌ์€ ๋Œ€์นญํ–‰๋ ฌ์ด๋‹ค.
    • ์ด์ฐจ ํŽธ๋ฏธ๋ถ„์ด ์—ฐ์†์ธ ๋ชจ๋“  ์ ์—์„œ๋Š” ๋ฏธ๋ถ„ ์—ฐ์‚ฐ์ž๊ฐ€ โ€œ๊ฐ€ํ™˜์ โ€์ด๋‹ค.
  • ํ•ด์„ธ ํ–‰๋ ฌ์˜ ๊ฐ’์ด ์‹ค์ˆ˜๊ฐ’, ๋Œ€์นญํ–‰๋ ฌ์ธ ๊ฒฝ์šฐ ํ•ด์„ธ ํ–‰๋ ฌ์„ ์‹ค์ˆ˜ ๊ณ ์œณ๊ฐ’๋“ค์˜ ์ง‘ํ•ฉ๊ณผ ๊ณ ์œ ๋ฒกํ„ฐ๋“ค๋กœ ์ด๋ฃจ์–ด์ง„ ์ง๊ต ๊ธฐ์ €๋กœ ๋ถ„ํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.

ํ™œ์šฉ

  • ํ—ค์„ธ ํ–‰๋ ฌ์€ ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜์˜ ๊ณก๋ฅ (์ฆ‰, ๋ณ€ํ™”์œจ์˜ ๋ณ€ํ™”)์„ ๋‚˜ํƒ€๋‚ด๊ธฐ ๋•Œ๋ฌธ์— ์ตœ์ ํ™” ๋ฌธ์ œ์—์„œ ์ค‘์š”ํ•จ
  • ํ•จ์ˆ˜์˜ ์ตœ์†Œ๊ฐ’์ด๋‚˜ ์ตœ๋Œ€๊ฐ’์„ ์ฐพ์„ ๋•Œ ํ—ค์„ธ ํ–‰๋ ฌ์˜ ์–‘์˜ ์ •๋ถ€ํ˜ธ ์—ฌ๋ถ€(์ฆ‰, ๋ชจ๋“  ๊ณ ์œ ๊ฐ’์ด ์–‘์ˆ˜์ธ์ง€)๋ฅผ ํ†ตํ•ด ํ•จ์ˆ˜๊ฐ€ ๋ณผ๋ก(convex)ํ•œ์ง€ ๋น„๋ณผ๋ก(non-convex)ํ•œ์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Œ
  • ์–‘์˜ ๊ณก๋ฅ ์ธ ๊ฒฝ์šฐ ๊ธฐ์šธ๊ธฐ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ๋ณด๋‹ค ๋Š๋ฆฌ๊ฒŒ ๋น„์šฉํ•จ์ˆ˜๊ฐ€ ๊ฐ์†Œํ•œ๋‹ค.
  • ์Œ์˜ ๊ณก๋ฅ ์ด๋ผ๋ฉด ๊ธฐ์šธ๊ธฐ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ๋ณด๋‹ค ๋น ๋ฅด๊ฒŒ ๋น„์šฉํ•จ์ˆ˜๊ฐ€ ๊ฐ์†Œํ•œ๋‹ค.

hessian-matrix-01.jpeg