ํ•ญ๊ณต๊ธฐ์˜ ์šดํ–‰์„ ๋”ฐ๋ผ๊ฐ€๋Š” Schedule์ด๋ผ๋Š” ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋†’์€ ์ •ํ™•๋„๋กœ ์ง€์—ฐํŽธ์„ ๊ฒ€์ถœํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

  • 2019.07~2019.11(4๊ฐœ์›”)
  • Pandas, Numpy, Lightgbm, sklearn
  • ํ•ญ๊ณต๊ธฐ ์ง€์—ฐ ์˜ˆ์ธก ๊ณผ์ œ
  • 100๋งŒ๊ฑด์˜ ๋ฐ์ดํ„ฐ ํ•ธ๋“ค๋ง
  • ํด๋ž˜์Šค ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ธฐ๋ฐ˜์ด์ž ๋ถ€์ŠคํŒ… ๋ชจ๋ธ์ธ Lightgbm ๋ชจ๋ธ ์‚ฌ์šฉ
  • ์ง€์—ฐ์— ๊ฐ€์žฅ ์˜ํ–ฅ์„ ๋ผ์น˜๋Š” ๋ฌธ์ œ๋Š” ๋น„ํ–‰๊ธฐ ๋…ธ์„ ์— ์žˆ์–ด์„œ ์—ฐ์ด์–ด ๋ฐœ์ƒํ•˜๋Š” A/C ๋ฌธ์ œ(ํ•ญ๊ณต๊ธฐ ์—ฐ๊ฒฐ ๋ฌธ์ œ)๋ผ๊ณ  ํŒ๋‹จ
  • ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์—์„œ ๋น„ํ–‰๊ธฐ์˜ ๋…ธ์„ ์€ ์ •ํ•ด์ ธ์žˆ๋‹ค๋Š” ๊ฐ€์ •์„ ๋„์ž…ํ•˜๊ณ , ์ด๋ฅผ ๊ฒ€์ฆ ํ›„ ์Šค์ผ€์ฅด์ด๋ผ๋Š” ๋ณ€์ˆ˜ ์ƒ์„ฑ
  • ์ง€์—ฐ์ด ์•„๋‹ˆ๋ผ ์˜ˆ์ธกํ–ˆ์œผ๋‚˜ ์‹ค์ œ๋กœ ์ง€์—ฐ์ธ ๊ฒฝ์šฐ(FN)๊ฐ€ ํ˜„์žฅ ๋„์ž…์‹œ ์น˜๋ช…์ ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋ฐ˜์˜ํ•˜๋„๋ก ์žฌํ˜„์œจ์— ์ดˆ์ ์„ ๋งž์ถฐ Threshold ์กฐ์ ˆ
  • โ€œ์Šค์ผ€์ฅดโ€ ๋ณ€์ˆ˜๋ฅผ ํ†ตํ•ด ์ •ํ™•๋„ 13% ๊ฐœ์„ , ์ตœ์ข…์ ์œผ๋กœ 76%์—์„œ 89%์˜ ์ •ํ™•๋„๋ฅผ ๊ฐ–๋Š” ๋ชจ๋ธ ๊ตฌ์ถ•

Project

Result

Reference