Descripter

์ด๋ฏธ์ง€๋ฅผ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ๋™์ผํ•œ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ํ•˜๋‚˜์˜ ๋น„๊ต ๋Œ€์ƒ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ

๋‘ ๊ฐ€์ง€ ์ด๋ฏธ์ง€๊ฐ€ ์žˆ๋‹ค. ์ด ๋‘๊ฐ€์ง€ ์ด๋ฏธ์ง€๊ฐ€ ๋น„์Šทํ•œ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์œ„ํ•ด ๋งŒ๋“  ๊ฒƒ์ด descripter์ด๋‹ค. ์œ„์˜ ๊ทธ๋ฆผ์—์„œ๋Š” ํ”ฝ์…€์˜ ๊ฐ’๋“ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ gradients๋ฅผ ๊ตฌํ•ด ์ด๋ฅผ grid์— plotํ•˜์—ฌ ํ‘œํ˜„ํ•˜์˜€๋‹ค. ์—ฌ๊ธฐ์„œ ์ด gradients๋ฅผ descripter๋กœ ์‚ฌ์šฉํ–ˆ๋‹ค๊ณ  ๋งํ•œ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด HOG ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๊ฐ pixel์—์„œ gradient๋ฅผ ๊ตฌํ•˜๊ณ  ์ด ๊ฐ’๋“ค์„ ์ด 8๊ฐ€์ง€ ๋ฐฉํ–ฅ์œผ๋กœ ๋งคํ•‘ํ•œ ํ›„, ํžˆ์Šคํ† ๊ทธ๋žจ์„ ์ƒ์„ฑํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ์ถ”์ถœ๋ˆ Feature vector๋Š” keypoint์ด๊ณ  ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ bounding box๋“ฑ์„ ๋งŒ๋“œ๋Š”๋ฐ ํ™œ์šฉํ•œ๋‹ค. ์š”์ฆ˜์€ ์ด feature mapCNN์„ ํ†ตํ•ด ์ƒ์„ฑํ•œ๋‹ค.

Region Proposal

์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์˜์—ญ์„ ์„ ํƒํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

๊ธฐ์กด์˜ sliding window๋ฐฉ์‹์€ ๋งค์šฐ ๋น„ํšจ์œจ์ ์ด์—ˆ๊ณ , ์ด๋ฅผ ๊ฐœ์„ ํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค. โ€œ๋ฌผ์ฒด๊ฐ€ ์žˆ์„ ๋ฒ•ํ•œโ€ ์˜์—ญ์„ ๋น ๋ฅธ ์†๋„๋กœ ์ฐพ์•„๋‚ด๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. ๋ณดํŽธ์ ์œผ๋กœ selective search, edge box algorithm์ด ์žˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด ์—ญ์‹œ๋„ ์ถ”ํ›„์— end-to-end ๋ฐฉ์‹์œผ๋กœ ๊ฐœ์„ ๋œ๋‹ค.

RoI(Region of Interest)

์ด๋ฏธ์ง€๋‚ด์—์„œ์˜ ๊ด€์‹ฌ ์˜์—ญ

์›๋ž˜ input์—์„œ ์ž˜๋ผ๋‚ธ ๊ด€์‹ฌ ์˜์—ญ๋“ค์„ RoI๋ผ ํ•œ๋‹ค.

Caption generation

์ด๋ฏธ์ง€๋กœ ๋ถ€ํ„ฐ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ

์ด ์—ฐ๊ตฌ๋Š” Human-object interaction์— ๊ธฐ์ดˆํ•˜์—ฌ ์—ฐ๊ตฌ๋˜๊ณ  ์žˆ๋‹ค.

Smooth L1 Loss

smooth\_{L_1}(x) = \\begin{cases} 0.5x^2 & \mbox {if }\left| x \right| \< 1 \mbox{ is even} \\ \\left| x \right|-0.5 & otherwise \\end{cases}

L1, L2 Loss๋Š” ์ƒ๋žตํ•˜์˜€๋‹ค. ์ˆ˜์‹์—์„œ์˜ x๋Š” ๋กœ ์ •๋‹ต label๊ณผ ์ฐจ์ด์ด๋‹ค. ์˜ค์ฐจ๊ฐ€ ์ž‘์€ ๋ถ€๋ถ„์€ ์ œ๊ณฑ์„ ์‚ฌ์šฉํ–ˆ๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์€ ๋ถ€๋ถ„์—์„œ๋Š” ์ง์„ ์„ ์‚ฌ์šฉํ–ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ L1 Loss์™€ L2 Loss์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉํ•œ ํ˜•ํƒœ์ด๋‹ค. ์ฆ‰, error๊ฐ€ ํด๊ฒฝ์šฐ ์•ˆ์ •์ ์œผ๋กœ loss๋ฅผ ๊ฐ์†Œ์‹œํ‚ค๊ณ () , ์ž‘์„ ๊ฒฝ์šฐ์—๋Š” L2 Loss๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์—…๋ฐ์ดํŠธ ๊ณผ์ •์ค‘ ์ง„๋™์„ ๊ฐ์†Œ์‹œํ‚จ๋‹ค.

IOU (Intersection over union)

์˜ˆ์ธกํ•œ bounding box์™€ ground truth box๊ฐ„์˜ ๊ฒน์น˜๋Š” ๋„“์ด ๋น„์œจ

์ด๊ฒƒ์€ ์‚ฌ์ง„์œผ๋กœ ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.

Ablation study

๊ธฐ์กด ๋ชจ๋ธ์—์„œ feature๋ฅผ ์ œ๊ฑฐํ•˜๋ฉด์„œ ์˜ํ–ฅ๋ ฅ์„ ํ™•์ธํ•˜๋Š” ๊ฒƒ

์—ฌ๊ธฐ์„œ feature๋Š” ๋ณ€์ˆ˜๋ณด๋‹ค๋Š” network, layer๋“ฑ์„ ๋งํ•œ๋‹ค.

Jittered examples

IoU๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์‚ฌ์šฉํ•˜๊ฒ ๋‹ค๊ณ  ํŒ๋‹จํ•œ bounding box

bounding box regression์„ ์ง„ํ–‰ํ•œ ํ›„์— ๊ฐ๊ฐ์˜ proposal์— ๋Œ€ํ•ด ์˜ˆ์ธกํ•œ ๊ฒฐ๊ณผ ์ค‘ ํ•™์Šต์— ์žฌ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•œ ์ƒ˜ํ”Œ์„ ๊ฑธ๋Ÿฌ๋‚ผ ๋•Œ ์‚ฌ์šฉ๋˜๋Š” ๊ฐœ๋…์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด IoU๊ฐ€ 0.5์ด์ƒ ์ธ ์ƒ˜ํ”Œ์„ positive sample์ด๋ผ ์ •์˜ํ•  ๊ฒฝ์šฐ, ์ด ์ƒ˜ํ”Œ์„ Jittered examples์ด๋ผ ํ•œ๋‹ค.

Non-maximum suppression (NMS)

๋™์ผํ•œ ํด๋ž˜์Šค๋ผ ํŒ๋ช…๋œ bounding box๋“ค ์ค‘ ์ค‘๋ณต์„ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ๋ฒ•

์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. ๋™์ผํ•œ ํด๋ž˜์Šค์— ๋Œ€ํ•ด ๊ฒ€์ถœ๋œ bounding box๋“ค์„ confidence ์ˆœ์„œ๋กœ ์ •๋ ฌํ•œ๋‹ค.
  2. ๊ฐ€์žฅ confidence๊ฐ€ ๋†’์€ bounding box์™€ IoU๊ฐ€ ์ผ์ • ์ด์ƒ์ธ bounding box๋Š” ๋™์ผ ๋ฌผ์ฒด๋ฅผ detectํ–ˆ๋‹ค ํŒ๋‹จํ•˜์—ฌ ์ง€์šด๋‹ค.
    • ๊ฐ€์žฅ confidence๋†’์€๊ฒƒ๋งŒ ๋‚จ๊ธฐ๊ณ  ๋ณดํ†ต 0.5์ด์ƒ box๋“ค์„ ์ง€์šด๋‹ค.

OHEM (Online Hard Example Mining)

๋จผ์ €, Hard Example๊ณผ Easy Example์˜ ๊ฐœ๋…๋ถ€ํ„ฐ ์•Œ์•„๋ณด์ž. ์‚ฌ๋žŒ์ธ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ชจ๋ธ์ด ์žˆ๋‹ค๊ณ  ํ•˜์ž. ์šฐ๋ฆฌ์˜ ๋ชฉ์ ์€ ์ด ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ฒƒ์ด๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ๋žŒ ์ด๋ฏธ์ง€๋Š” ๋ถ„๋ฅ˜ํ•˜๋„๋ก ๋งŒ๋“ค์—ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‚ฌ๋žŒ ๋™์ƒ๊ณผ ๊ฐ™์€ ์ƒ˜ํ”Œ์— ๋Œ€ํ•ด์„œ๋Š” ๋ชจ๋ธ์ด ๊ตฌ๋ถ„ํ•˜๊ธฐ ์–ด๋ ค์šธ ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ ์ผ๋ฐ˜์ ์œผ๋กœ ์ž˜ ๋™์ž‘ํ•˜๋Š” ์ƒ˜ํ”Œ์„ Easy Example, ์‚ฌ๋žŒ ๋™์ƒ ์ด๋ฏธ์ง€๋ฅผ Hard Example ์ด๋ผ ํ•œ๋‹ค. ์ด๋Ÿฐ ๊ฒƒ๋“ค์„ ์ œ๋Œ€๋กœ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” Hard Example์— ๋Œ€ํ•ด ๊ฐ€์ค‘์น˜๋ฅผ ์ฃผ๊ฑฐ๋‚˜ ํ•ด์„œ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œ์ผœ์•ผ ํ•  ๊ฒƒ์ด๋‹ค.

๋‹ค์Œ์€ positive์™€ negative์— ๋Œ€ํ•œ ๊ฐœ๋…์ด๋‹ค. positive๋Š” ๋ฌธ์ œ์—์„œ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ํด๋ž˜์Šค๋ฅผ ์˜๋ฏธํ•œ๋‹ค. positive sample์€ bounding box์˜ label์ด ์‚ฌ๋žŒ์ธ ๊ฒƒ์„ ์˜๋ฏธํ•˜๊ณ , negative sample์€ ๋ฐฐ๊ฒฝ์ž„์„ ์˜๋ฏธํ•œ๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด hard negative๋ž€, ์‹ค์ œ๋กœ๋Š” ๋ฐฐ๊ฒฝ์ธ๋ฐ, ์‚ฌ๋žŒ์ด๋ผ๊ณ  ์˜ˆ์ธกํ•œ sample์ด๋‹ค. ๋ฐ˜๋Œ€๋กœ easy negative๋Š” ์‹ค์ œ๋กœ ๋ฐฐ๊ฒฝ์ด๋ฉฐ ๋ฐฐ๊ฒฝ์œผ๋กœ ์˜ˆ์ธกํ–ˆ์Œ์„ ์˜๋ฏธํ•œ๋‹ค.

์ฆ‰, hard negative sample์€, ๋„ค๊ฑฐํ‹ฐ๋ธŒ ์ƒ˜ํ”Œ์ด๋ผ๊ณ  ๋ณด๊ธฐ ์–ด๋ ต๋‹ค๋ผ๋Š” ์˜๋ฏธ์ด๋‹ค. ํ•ด๋‹น ์ƒ˜ํ”Œ์— ๋Œ€ํ•ด ๋ฐฐ๊ฒฝ์ด๋ผ๊ณ  ๋งํ•ด์•ผ ํ•˜๋Š”๋ฐ, confidence๋Š” ๋†’๊ฒŒ ๋‚˜์˜ค๋Š” ์ƒํ™ฉ์„ ๋งํ•œ๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ์•Œ์•„๋ณผ object detection๋ฌธ์ œ์—์„œ๋Š” resion proposal์„ ํ†ตํ•ด ์—ฌ๋Ÿฌ๊ฐ€์ง€ ํ›„๋ณด๋ฅผ ์„ ํƒํ•˜๊ฒŒ ๋œ๋‹ค. ์ด ํ›„๋ณด๊ตฐ์˜ ๋Œ€๋ถ€๋ถ„์€ ๋ฐฐ๊ฒฝ์ด๋ผ๊ณ  ๋งํ•ด์•ผ ํ•˜๋Š” easy negative sample์ด ์ฐจ์ง€ํ•˜๊ณ  ์žˆ๋‹ค. ๋˜ํ•œ ์‚ฌ๋žŒ์ด๋ผ๊ณ  ๋งํ•ด์•ผ ํ•˜๋Š” positive sample์˜ ๊ฐœ์ˆ˜๋Š” ๋งค์šฐ ๋ถ€์กฑํ•˜๋‹ค. ๋ณดํ†ต ์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ๋Š” ๋ชจ์ง‘๋‹จ์˜ balance๋ฅผ ๋งž์ถ”๋Š” resampling์„ ์ง„ํ–‰ํ•˜๊ฑฐ๋‚˜, boosting์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์ง„ํ–‰ํ•˜๊ฒŒ ๋œ๋‹ค. ํ•˜์ง€๋งŒ ์ด๊ฒƒ์€ label์˜ ๋ถˆ๊ท ํ˜•์„ ์•Œ๊ณ ์žˆ๊ณ , ์ด๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์„ ๋•Œ ๊ฐ€๋Šฅํ•˜๋‹ค. detection๋ฌธ์ œ๋Š” ํ›„๋ณด๊ตฐ์˜ label์„ ๋ชจ๋ฅด๊ธฐ ๋•Œ๋ฌธ์— ์ด ๋ฐฉ๋ฒ•์€ ์‚ฌ์šฉํ•  ์ˆ˜ ์—†๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ๋งŒ์•ฝ ์ด ์ƒํ™ฉ์—์„œ ๊ทธ๋Œ€๋กœ ํ›ˆ๋ จ์„ ์ง„ํ–‰ํ•˜๊ฒŒ ๋˜๋ฉด, easy negative sample์˜ ์–‘์ด ๋„ˆ๋ฌด ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— **๋ฐฐ๊ฒฝ์„ ๋ฐฐ๊ฒฝ์ด๋ผ ํ•˜๋Š” ์˜ˆ์ธก**๋งŒ์ด ๋Œ€๋‹ค์ˆ˜๋ฅผ ์ด๋ฃจ๊ณ , ์ด์— ๋Œ€ํ•ด์„œ๋งŒ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๊ฒŒ ๋œ๋‹ค.

์ผ๋ฐ˜์ ์œผ๋กœ Classification์—์„œ ์‚ฌ์šฉํ•˜๋Š” Loss ํ•จ์ˆ˜๋Š” Cross Entropy ์ด๋‹ค. ์ด๋Ÿฌํ•œ imbalance๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ์—…๋ฐ์ดํŠธ๋ฅผ ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์—, ๊ธฐ์กด์˜ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•  ๊ฒฝ์šฐ, background๋งŒ ์ž˜ ๋งž์ถ”๋Š” ์š”์ƒํ•œ ๋ชจ๋ธ์ด ๊ฒฐ๊ณผ๋กœ ๋„์ถœ๋œ๋‹ค.

์šฐ๋ฆฌ๋Š” ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ฐฐ๊ฒฝ์€ ๋ฐฐ๊ฒฝ์ด๋ผํ•˜๊ณ , ์‚ฌ๋žŒ์€ ์‚ฌ๋žŒ์ด๋ผ๊ณ  ํ•˜๋Š” ์ข‹์€ ๋ชจ๋ธ์„ ์ œ์ž‘ํ•ด์•ผ ํ•œ๋‹ค. ๊ทธ๋Ÿฌ๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ›„๋ณด๊ตฐ์˜ ๋Œ€๋ถ€๋ถ„์„ ์ฐจ์ง€ํ•˜๊ณ  ์žˆ๋Š” easy negative sample์— ๋Œ€ํ•ด์„œ ์—…๋ฐ์ดํŠธ๋Š” ์ค„์ด๊ณ , ๋ฐฐ๊ฒฝ์ธ๋ฐ ๋ฐฐ๊ฒฝ์ด ์•„๋‹ˆ๋ผ๊ณ  ํ•˜๋Š” hard negative sample์— ๋Œ€ํ•ด ์ฃผ๋œ ์—…๋ฐ์ดํŠธ๋ฅผ ์ง„ํ–‰ํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์ด OHEM (Online Hard Example Mining)์ด๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ positive sample๊ณผ hard negative sample์„ ๊ฐ€์ง€๊ณ  ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค. ์ด์™€ ๊ฐ™์€ ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ๋ฅผ Class Imbalance๋ผ ํ•œ๋‹ค.

Focal Loss

์œ„์˜ OHEM๊ณผ ๋น„์Šทํ•˜๊ฒŒ class Imbalance๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค. loss function์„ ์ˆ˜์ •ํ•˜์—ฌ ์ด๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค.

p_t = \\begin{cases} p & \mbox {if } y = 1 \\ 1-p & otherwise \\end{cases} \\ FL(p_t) = -(1-p_t)^\gamma log(p_t)

์ด๋Ÿฐ loss funtion์„ ์ดํ•ดํ•˜๋Š” ๊ฐ€์žฅ ์ข‹์€ ๋ฐฉ๋ฒ•์€ ์–‘ ๊ทน๋‹จ์น˜๋ฅผ ๋„ฃ์–ด๋ณด๋Š” ๊ฒƒ์ด๋‹ค. y=1์ผ ๊ฒฝ์šฐ, ground truth๊ฐ€ ์‚ฌ๋žŒ์ธ ๊ฒฝ์šฐ์—๋Š” ํ•ด๋‹น class๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ์„ ๊ทธ๋Œ€๋กœ ๋„ฃ์–ด์ค€๋‹ค. ์ฆ‰ ์ด๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ๋งŒ์•ฝ ์ž˜ ๋งž์ท„์„ ๊ฒฝ์šฐ์—๋Š” loss๊ฐ€ 0์— ๊ฐ€๊นŒ์›Œ์ง„๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ postitive์— ๋Œ€ํ•ด ์ž˜ ์˜ˆ์ธกํ•  ๊ฒฝ์šฐ loss๋ฅผ ์ž‘๊ฒŒ ์ฃผ๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์€ ๊ฒฝ์šฐ loss๋ฅผ ํฌ๊ฒŒ ์ค€๋‹ค.

y!=1์ธ ๊ฒฝ์šฐ, ์ด๊ณ , ๊ทธ๋ ‡๊ฒŒ ๋  ๊ฒฝ์šฐ ์ด๋‹ค. cross entropy์‹์—์„œ ์•žํ•ญ๊ณผ ๋’ค ํ•ญ์˜ ๋ณ€ํ˜•์„ ํ†ตํ•ด logํ•จ์ˆ˜๊ฐ€ ๊ฐ€์ง€๋Š” ํŠน์ง•์„ ์‚ฌ์šฉํ–ˆ๋‹ค. ์ž˜ ์˜ˆ์ธกํ•  ๊ฒฝ์šฐ loss๋ฅผ ํฌ๊ฒŒ ์ฃผ๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์„ ๊ฒฝ์šฐ loss๋ฅผ ์ž‘๊ฒŒ์ค€๋‹ค. ๋‹ค๋งŒ log ํ•จ์ˆ˜์— ์—ฎ์—ฌ ์žˆ๋Š” ๋ถ€๋ถ„์€ ์ž˜ ์˜ˆ์ธกํ–ˆ์„ ๊ฒฝ์šฐ์— ๋” ํฐ loss๊ฐ’์„ ์ฃผ๊ฒŒ ๋˜๋ฏ€๋กœ, ์ด ์‹์˜ ์˜๋„๋Š”, ๋„ˆ๋ฌด ์ž˜ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ์ดํ„ฐ(p๊ฐ€ ๊ณ„์† ๋„ˆ๋ฌด ๋†’๊ฒŒ ๋‚˜์˜ด)์˜ ์˜ํ–ฅ๋ ฅ์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ๊ฒƒ์ด ๊ฐ•ํ•˜๋‹ค. ์‹ค์ œ๋กœ OHEM ๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋” ์ข‹๋‹ค๊ณ  ํ•œ๋‹ค.

Contextual feature

2d image์—์„œ contextual based classification์€ pixel์˜ ์ฃผ๋ณ€ neighborhood ๊ณผ์˜ relationship์— ์ดˆ์ ์„ ๋งž์ถ˜ approach๋ฅผ ๋œปํ•œ๋‹ค. ์ฆ‰, ์–ด๋–ค ํŠน์ • pixel์˜ contextual feature๋Š” ์ฃผ๋ณ€ pixel๋“ค๊ณผ์˜ relationship์— ๊ธฐ๋ฐ˜ํ•ด์„œ ์ถ”์ถœํ•œ feature๋ฅผ ๋œปํ•œ๋‹ค.

Reference