์ •๋ณด์ด๋ก ์—์„œ ํ™•๋ฅ  ๋ณ€์ˆ˜(Random Variable) ์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ์ •๋Ÿ‰ํ™”ํ•˜๋Š” ์ฒ™๋„

Shannon Entropy

  • ์ด์‚ฐ ํ™•๋ฅ  ๋ณ€์ˆ˜ ์˜ ์„€๋„Œ ์—”ํŠธ๋กœํ”ผ ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค.
  • : ํ™•๋ฅ  ๋ณ€์ˆ˜ ์˜ ํ™•๋ฅ  ์งˆ๋Ÿ‰ ํ•จ์ˆ˜
  • : ํ™•๋ฅ ๋ณ€์ˆ˜ ๊ฐ€ ์ทจํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ’๋“ค์˜ ์ง‘ํ•ฉ

์„ฑ์งˆ

  1. E\[-\log p(X)\] = H(X)
  2. : ์— ๋Œ€ํ•ด ์ตœ๋Œ€ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ฐ–๋Š” ํ™•๋ฅ  ๋ถ„ํฌ๋Š” ๊ท ๋“ฑ ๋ถ„ํฌ์ด๋‹ค.
  3. ์ž„์˜์˜ ํ™•๋ฅ ๋ถ„ํฌ ์— ๋Œ€ํ•ด ๋Š” ์˜ค๋ชฉํ•จ์ˆ˜(Convex)์ด๋‹ค.
  4. ๋กœ๊ทธ์˜ ๋ฐ‘์€ ๋ณดํ†ต 2์ด๋ฉฐ, ์„€๋„Œ ์—”ํŠธ๋กœํ”ผ์˜ ๋‹จ์œ„๋Š” ๋น„ํŠธ

๊ฐœ๋…

  • ์‚ฌ๊ฑด์˜ ๋ฐœ์ƒ ํ™•๋ฅ ์ด ๊ท ๋“ฑํ• ์ˆ˜๋ก(์ฆ‰, ๋ชจ๋“  ์‚ฌ๊ฑด์ด ๋ฐœ์ƒํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋™์ผํ•  ๋•Œ), ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์ตœ๋Œ€๊ฐ€ ๋œ๋‹ค.
  • ํŠน์ • ์‚ฌ๊ฑด์˜ ๋ฐœ์ƒ ํ™•๋ฅ ์ด ๋งค์šฐ ๋†’๊ฑฐ๋‚˜ ๋‚ฎ๋‹ค๋ฉด, ์—”ํŠธ๋กœํ”ผ๋Š” ๋‚ฎ์•„์ง„๋‹ค. ์ด๋Š” ์‹œ์Šคํ…œ์ด ๋” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

์˜ˆ์‹œ

๋™์ „ ๋˜์ง€๊ธฐ

  • ๊ณต์ •ํ•œ ๋™์ „์˜ ์•ž๋ฉด๊ณผ ๋’ท๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์€ ๊ฐ๊ฐ 0.5์ž…๋‹ˆ๋‹ค.
  • ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•ด ๋ณด๋ฉด:

  • ์ด ๊ฒฝ์šฐ, ์—”ํŠธ๋กœํ”ผ๋Š” ์ตœ๋Œ€๊ฐ’์ธ 1 ๋น„ํŠธ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์šด ์ƒํƒœ๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

ํŽธํ–ฅ๋œ ๋™์ „ ๋˜์ง€๊ธฐ

  • ๋งŒ์•ฝ ๋™์ „์ด ํŽธํ–ฅ๋˜์–ด ์•ž๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์ด 0.9, ๋’ท๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์ด 0.1์ด๋ผ๋ฉด:

  • ์—”ํŠธ๋กœํ”ผ๊ฐ€ 1 ๋น„ํŠธ๋ณด๋‹ค ์ž‘์•„์กŒ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋™์ „ ๋˜์ง€๊ธฐ์˜ ๊ฒฐ๊ณผ๋ฅผ ๋” ์˜ˆ์ธกํ•˜๊ธฐ ์‰ฌ์šด ์ƒํƒœ๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

์ฃผ์‚ฌ์œ„ ๋˜์ง€๊ธฐ

  • ๊ณต์ •ํ•œ 6๋ฉด์ฒด ์ฃผ์‚ฌ์œ„์˜ ๊ฐ ๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์€ ์ž…๋‹ˆ๋‹ค.
  • ์ด ๊ฒฝ์šฐ ์—”ํŠธ๋กœํ”ผ๋Š”:

  • ์ด์ฒ˜๋Ÿผ ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€ ๋งŽ์•„์ง€๋ฉด ์—”ํŠธ๋กœํ”ผ๋„ ์ฆ๊ฐ€ํ•˜์—ฌ, ๋” ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์šด ์ƒํƒœ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

Reference