AI๊ฐ€ ์ปค์ง„๋‹ค๋Š” ๋ง์€ ํ•˜๋‚˜๋กœ ๋“ค๋ฆฌ์ง€๋งŒ, ์‹ค์ œ ๋ณ‘๋ชฉ์€ ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ ์ธต์—์„œ ์ƒ๊ธด๋‹ค. ํ•˜๋‚˜๋Š” AI agent๋ฅผ ์˜ค๋ž˜, ์•ˆ์ „ํ•˜๊ฒŒ, ๋ณต๊ตฌ ๊ฐ€๋Šฅํ•˜๊ฒŒ ์‹คํ–‰ํ•˜๋Š” runtime ๋ฌธ์ œ์ด๊ณ , ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” AI ์‚ฌ์šฉ๋Ÿ‰์„ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ์„ผํ„ฐยท์นฉยท์ „๋ ฅยท์žฅ๋น„ ํˆฌ์ž๊ฐ€ ์ปค์ง€๋Š” capex cycle ๋ฌธ์ œ๋‹ค.

๋‘ ํ๋ฆ„์€ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ์ง€๋งŒ ๊ฐ™์€ ๋ฌธ์ œ๊ฐ€ ์•„๋‹ˆ๋‹ค. ์ „์ž๋Š” agent๊ฐ€ ์‹ค์ œ ์—…๋ฌด ๋„๊ตฌ๋ฅผ ๋งŒ์งˆ ๋•Œ โ€œ์–ด๋–ป๊ฒŒ ํ†ต์ œํ•˜๊ณ  ๊ธฐ๋กํ•˜๊ณ  ์žฌ์‹œ์ž‘ํ•  ๊ฒƒ์ธ๊ฐ€โ€๋ฅผ ๋ฌป๋Š”๋‹ค. ํ›„์ž๋Š” inference ์ˆ˜์š”๊ฐ€ ๋Š˜์–ด๋‚  ๋•Œ โ€œ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ๋ฌผ๋ฆฌ ์ธํ”„๋ผ๋ฅผ ์ง€์–ด์•ผ ํ•˜๊ณ , ๊ทธ ๋น„์šฉ๊ณผ ๋ณ‘๋ชฉ์ด ์–ด๋””๋กœ ๋ฒˆ์ง€๋Š”๊ฐ€โ€๋ฅผ ๋ฌป๋Š”๋‹ค.

ํ•œ ์ค„๋กœ ๋งํ•˜๋ฉด

AI agent runtime์€ AI๊ฐ€ ์ผ์„ ๋งก์„ ๋•Œ ์•ˆ์ „ํ•˜๊ฒŒ ์˜ค๋ž˜ ๊ตด๋Ÿฌ๊ฐ€๊ฒŒ ํ•˜๋Š” ์šด์˜ ๊ตฌ์กฐ์ด๊ณ , AI capex cycle์€ AI ์‚ฌ์šฉ๋Ÿ‰์ด ๋ฌผ๋ฆฌ ์ธํ”„๋ผ ํˆฌ์ž์™€ ์‹œ์žฅ narrative๋กœ ๋ฒˆ์ง€๋Š” ๊ตฌ์กฐ๋‹ค.

๋น„์œ ๋กœ ์ดํ•ดํ•˜๊ธฐ

AI agent runtime์€ ํšŒ์‚ฌ์˜ ์—…๋ฌด ์šด์˜ ์‹œ์Šคํ…œ์— ๊ฐ€๊น๋‹ค. ์ง์›์—๊ฒŒ ์ผ์„ ๋งก๊ธฐ๋ ค๋ฉด ์ฑ…์ƒ, ๋ฌธ์„œํ•จ, ๊ถŒํ•œ, ์Šน์ธ ์ ˆ์ฐจ, ์ž‘์—… ๊ธฐ๋ก, ์‚ฌ๊ณ  ๋Œ€์‘ ๋ฐฉ์‹์ด ์žˆ์–ด์•ผ ํ•œ๋‹ค. ์ง์›์ด ๋˜‘๋˜‘ํ•˜๋”๋ผ๋„ ์ถœ์ž…์ฆ์„ ์•„๋ฌด ๋ฐ๋‚˜ ์—ด ์ˆ˜ ์žˆ๊ฒŒ ๋‘๊ฑฐ๋‚˜, ์ž‘์—… ๊ธฐ๋ก์ด ์‚ฌ๋ผ์ง€๊ฑฐ๋‚˜, ๋ฌธ์ œ๊ฐ€ ์ƒ๊ฒผ์„ ๋•Œ ์–ด๋””์„œ ๋‹ค์‹œ ์‹œ์ž‘ํ• ์ง€ ๋ชจ๋ฅด๋ฉด ์‹ค์ œ ์—…๋ฌด๋ฅผ ๋งก๊ธฐ๊ธฐ ์–ด๋ ต๋‹ค.

AI capex cycle์€ ๊ณต์žฅ๊ณผ ์ „๋ ฅ๋ง์— ๊ฐ€๊น๋‹ค. ์ฃผ๋ฌธ์ด ๋Š˜๋ฉด ๊ณต์žฅ์„ ๋” ์ง“๊ณ , ์žฅ๋น„๋ฅผ ์‚ฌ๊ณ , ์ „๊ธฐ๋ฅผ ๋Œ์–ด์˜ค๊ณ , ๋ƒ‰๊ฐ๊ณผ ๋ฌผ๋ฅ˜๋ฅผ ๋งž์ถฐ์•ผ ํ•œ๋‹ค. ์ฃผ๋ฌธ์„ ๋ฐ›๋Š” ์†Œํ”„ํŠธ์›จ์–ด๊ฐ€ ์ข‹์•„๋„ ์ƒ์‚ฐ ์„ค๋น„๊ฐ€ ๋ถ€์กฑํ•˜๋ฉด ๋‚ฉ๊ธฐ๊ฐ€ ๋ฐ€๋ฆฌ๊ณ  ๋น„์šฉ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค.

์ด ๋น„์œ ์—์„œ ์ค‘์š”ํ•œ ์ ์€ ๋‘˜์˜ ๋ณ‘๋ชฉ์ด ๋‹ค๋ฅด๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์—…๋ฌด ์šด์˜ ์‹œ์Šคํ…œ์€ ๊ถŒํ•œยท๊ธฐ๋กยท๋ณต๊ตฌยท๊ฐ์‚ฌ ๊ฐ€๋Šฅ์„ฑ์ด ํ•ต์‹ฌ์ด๊ณ , ๊ณต์žฅยท์ „๋ ฅ๋ง์€ ์„ค๋น„ ํˆฌ์žยท๊ณต๊ธ‰๋งยท์ „๋ ฅยท๋ƒ‰๊ฐยท์ž๋ณธ ๋น„์šฉ์ด ํ•ต์‹ฌ์ด๋‹ค.

๋น„๊ต ํ‘œ

๊ตฌ๋ถ„AI agent runtimeAI capex cycle
ํ•ต์‹ฌ ์งˆ๋ฌธagent๊ฐ€ ์‹ค์ œ ์ผ์„ ์•ˆ์ „ํ•˜๊ฒŒ ์˜ค๋ž˜ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€AI ์‚ฌ์šฉ๋Ÿ‰์„ ์ฒ˜๋ฆฌํ•  ๋ฌผ๋ฆฌ ์ธํ”„๋ผ๊ฐ€ ์ถฉ๋ถ„ํ•œ๊ฐ€
๋Œ€ํ‘œ ๊ฐœ๋…[[Concepts/managed-agentsManaged agents]], [[Concepts/loop-engineering
์ฃผ์š” ๋ณ‘๋ชฉsession log, sandbox, credential boundary, tool permission, audit trailGPU/AI accelerator, [[Concepts/hbm
์‹คํŒจ ์–‘์‹๊ถŒํ•œ ๋…ธ์ถœ, context ์†์‹ค, ๋ฉˆ์ถ”์ง€ ์•Š๋Š” loop, ๋ณต๊ตฌ ๋ถˆ๊ฐ€, ๊ฐ์‚ฌ ๋ถˆ๊ฐ€๋Šฅ๊ณผ์ž‰ํˆฌ์ž, ์ „๋ ฅ ๋ถ€์กฑ, ๊ณต๊ธ‰๋ง ๋ณ‘๋ชฉ, [[Concepts/cost-per-token
๋ด์•ผ ํ•  ์ง€ํ‘œtool call ๊ธฐ๋ก, ๊ถŒํ•œ ๋ถ„๋ฆฌ, ์žฌ์‹œ์ž‘ ๊ฐ€๋Šฅ์„ฑ, ์Šน์ธ/๊ฐ์‚ฌ ์ ˆ์ฐจcapex ๊ณ„ํš, ์ „๋ ฅ ๊ณ„์•ฝ, rack density, utilization, [[Concepts/cost-per-token
์‚ฐ์—… ์งˆ๋ฌธ์–ด๋–ค ์ œํ’ˆ์ด enterprise ์—…๋ฌด์— ๋“ค์–ด๊ฐˆ ์ˆ˜ ์žˆ๋Š”๊ฐ€์–ด๋–ค ๊ธฐ์—…๊ณผ ๊ณต๊ธ‰๋ง์ด AI ์ธํ”„๋ผ ์ง€์ถœ์˜ ๋ณ‘๋ชฉ์— ์žˆ๋Š”๊ฐ€

AI agent runtime์€ โ€œ์ผ์„ ๋งก๊ธฐ๋Š” ๊ตฌ์กฐโ€์˜ ๋ฌธ์ œ๋‹ค

Managed agents๋Š” ๋ชจ๋ธ, ์‹คํ–‰ ํ™˜๊ฒฝ, session ๊ธฐ๋ก์„ ๋ถ„๋ฆฌํ•ด ์žฅ๊ธฐ ์‹คํ–‰ agent๋ฅผ ๋” ์•ˆ์ •์ ์œผ๋กœ ๋งŒ๋“ค๋ ค๋Š” ๊ตฌ์กฐ๋‹ค. Anthropic์ด ๋งํ•œ brainยทhandsยทsession ๊ตฌ๋ถ„์€ ์ด ์ธต์˜ ๋ฌธ์ œ๋ฅผ ์ž˜ ๋ณด์—ฌ์ค€๋‹ค. ๋ชจ๋ธ์ด ๋‹ค์Œ ํ–‰๋™์„ ์ •ํ•˜๋Š” ๋ถ€๋ถ„๊ณผ ์ฝ”๋“œ ์‹คํ–‰ยท๋„๊ตฌ ํ˜ธ์ถœ์ด ์ผ์–ด๋‚˜๋Š” ๋ถ€๋ถ„, ๊ทธ๋ฆฌ๊ณ  ์ž‘์—… ๊ธฐ๋ก์„ ๋ณด์กดํ•˜๋Š” ๋ถ€๋ถ„์„ ๋‚˜๋ˆ„์–ด์•ผ ์žฅ์• ์™€ ๋ณด์•ˆ ๋ฌธ์ œ๋ฅผ ๊ฒฌ๋””๊ธฐ ์‰ฝ๋‹ค.

Loop engineering๋„ ๊ฐ™์€ ๋ฐฉํ–ฅ์„ ๊ฐ€๋ฆฌํ‚จ๋‹ค. agent๋ฅผ ํ”„๋กฌํ”„ํŠธ ํ•œ ๋ฒˆ์œผ๋กœ ๋๋‚˜๋Š” ๋‹ต๋ณ€๊ธฐ๊ฐ€ ์•„๋‹ˆ๋ผ, queue, retry, verifier, state, observability๊ฐ€ ์žˆ๋Š” ์‹คํ–‰ ์‹œ์Šคํ…œ์œผ๋กœ ๋ณด์ž๋Š” ๊ด€์ ์ด๋‹ค. ์ด๋•Œ ํ•ต์‹ฌ์€ โ€œ๋” ์˜ค๋ž˜ ๋Œ๋ฆฐ๋‹คโ€๊ฐ€ ์•„๋‹ˆ๋ผ โ€œ์‹คํŒจํ•ด๋„ ๋ฉˆ์ถ”๊ณ , ๊ธฐ๋กํ•˜๊ณ , ๋‹ค์‹œ ์‹œ์ž‘ํ•˜๊ณ , ๊ถŒํ•œ์„ ๋„˜์ง€ ์•Š๊ฒŒ ๋งŒ๋“ ๋‹คโ€์ด๋‹ค.

๊ทธ๋ž˜์„œ agent runtime์„ ๋ณผ ๋•Œ๋Š” ๋ชจ๋ธ ์ด๋ฆ„๋ณด๋‹ค ๋‹ค์Œ ์งˆ๋ฌธ์ด ๋” ์ค‘์š”ํ•ด์งˆ ์ˆ˜ ์žˆ๋‹ค.

  • session log๊ฐ€ context window ๋ฐ–์— durableํ•˜๊ฒŒ ๋‚จ๋Š”๊ฐ€?
  • sandbox์™€ credential์ด ๋ถ„๋ฆฌ๋˜์–ด ์žˆ๋Š”๊ฐ€?
  • agent๊ฐ€ ์–ด๋–ค tool์„ ์–ด๋–ค ๊ถŒํ•œ์œผ๋กœ ํ˜ธ์ถœํ–ˆ๋Š”์ง€ ์ถ”์  ๊ฐ€๋Šฅํ•œ๊ฐ€?
  • ์‹คํŒจํ•œ harness๋‚˜ ์‹คํ–‰ ํ™˜๊ฒฝ์„ ๊ต์ฒดํ•˜๊ณ  ์ด์–ด๊ฐˆ ์ˆ˜ ์žˆ๋Š”๊ฐ€?
  • ์ค‘์š”ํ•œ ํ–‰๋™์—๋Š” ์‚ฌ๋žŒ ์Šน์ธ ๋˜๋Š” ์ •์ฑ… ๊ธฐ๋ฐ˜ ์ œํ•œ์ด ๋“ค์–ด๊ฐ€๋Š”๊ฐ€?

์ด ์งˆ๋ฌธ๋“ค์€ Agent containment์™€ AI ์‹œ์Šคํ…œ์˜ ๊ฐ์‚ฌ ๊ฐ€๋Šฅ์„ฑ์œผ๋กœ ์ด์–ด์ง„๋‹ค. agent๊ฐ€ ์‹ค์ œ ํŒŒ์ผ, ์ฝ”๋“œ, ์—…๋ฌด ๋„๊ตฌ, ์™ธ๋ถ€ API๋ฅผ ๋งŒ์งˆ์ˆ˜๋ก โ€œ๋˜‘๋˜‘ํ•œ๊ฐ€โ€๋ณด๋‹ค โ€œํ”ผํ•ด ๋ฒ”์œ„๊ฐ€ ์ œํ•œ๋˜์–ด ์žˆ๋Š”๊ฐ€โ€์™€ โ€œ๋‚˜์ค‘์— ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€โ€๊ฐ€ ์ฑ„ํƒ์˜ ์กฐ๊ฑด์ด ๋œ๋‹ค.

AI capex cycle์€ โ€œAI ์‚ฌ์šฉ๋Ÿ‰์„ ๊ฐ๋‹นํ•˜๋Š” ์„ค๋น„โ€์˜ ๋ฌธ์ œ๋‹ค

๋ฐ˜๋Œ€๋กœ AI capex cycle์€ agent๊ฐ€ ์–ด๋–ค ์ผ์„ ๋งก๋Š”์ง€๋ณด๋‹ค, ๊ทธ ์ผ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๋ฌผ๋ฆฌ ์ธํ”„๋ผ๊ฐ€ ์–ด๋–ป๊ฒŒ ์ปค์ง€๋Š”์ง€๋ฅผ ๋ณธ๋‹ค. AI ์„œ๋น„์Šค ์‚ฌ์šฉ๋Ÿ‰์ด ๋Š˜๋ฉด inference ์š”์ฒญ์ด ๋Š˜๊ณ , inference ์š”์ฒญ์€ chip, memory, networking, ์ „๋ ฅ, ๋ƒ‰๊ฐ, rack, ๊ฑด์„ค, ์ „๋ ฅ ์žฅ๋น„ ์ˆ˜์š”๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.

LLM inference serving์—์„œ ์ค‘์š”ํ•œ ์ ์€ ํ•™์Šต์ด ๋๋‚œ ๋ชจ๋ธ๋„ ์‹ค์ œ ์ œํ’ˆ์—์„œ๋Š” ๋งค ์š”์ฒญ๋งˆ๋‹ค ๊ณ„์† ์‹คํ–‰๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๋Š˜๋ฉด cost per token, latency, memory bandwidth, KV cache, interconnect, scheduler, power per rack์ด ์ˆ˜์ต์„ฑ๊ณผ ์‚ฌ์šฉ์ž ๊ฒฝํ—˜์„ ๋ฐ”๊พผ๋‹ค.

Etched์˜ rack-scale inference system ์ธํ„ฐ๋ทฐ๊ฐ€ ๋‹จ์ผ chip ์„ฑ๋Šฅ๋ณด๋‹ค rack ๋‹จ์œ„ memory์™€ interconnect๋ฅผ ๊ฐ•์กฐํ•œ ๊ฒƒ๋„ ์ด ๋ฌธ์ œ์™€ ๋งž๋‹ฟ์•„ ์žˆ๋‹ค. ํšŒ์‚ฌ์˜ ์ฃผ์žฅ์ด ๊ฒ€์ฆ๋๋‹ค๋Š” ๋œป์€ ์•„๋‹ˆ์ง€๋งŒ, inference ๊ฒฝ์Ÿ์ด chip ํ•˜๋‚˜์˜ benchmark๋ฅผ ๋„˜์–ด serving economics์™€ ๋ฌผ๋ฆฌ ์‹œ์Šคํ…œ ์„ค๊ณ„๋กœ ๋„“์–ด์ง„๋‹ค๋Š” ์‹ ํ˜ธ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ๋‹ค.

AI capex cycle์„ ๋ณผ ๋•Œ ํ•„์š”ํ•œ ์งˆ๋ฌธ์€ ๋‹ค์Œ์— ๊ฐ€๊น๋‹ค.

  • AI ์‚ฌ์šฉ๋Ÿ‰ ์ฆ๊ฐ€๊ฐ€ ์‹ค์ œ compute ์ˆ˜์š”์™€ ๋งค์ถœ๋กœ ์ด์–ด์ง€๋Š”๊ฐ€?
  • ๋ฐ์ดํ„ฐ์„ผํ„ฐ ์ „๋ ฅยท๋ƒ‰๊ฐยท๋ถ€์ง€ยท๋ณ€์••๊ธฐยทswitchgear๊ฐ€ ๋ณ‘๋ชฉ์ด ๋˜๋Š”๊ฐ€?
  • memory, networking, advanced packaging ๊ฐ™์€ ๊ณต๊ธ‰๋ง์ด ์ถฉ๋ถ„ํ•œ๊ฐ€?
  • cost per token์ด ๋‚ด๋ ค๊ฐ€๊ณ  ์žˆ๋Š”๊ฐ€, ์•„๋‹ˆ๋ฉด capex ๋ถ€๋‹ด์ด ๋” ๋นจ๋ฆฌ ์ปค์ง€๋Š”๊ฐ€?
  • ์„ค๋น„ ํˆฌ์ž๊ฐ€ ๊ณผ์ž‰ํˆฌ์ž๋กœ ๋ฐ”๋€” ์œ„ํ—˜์€ ์—†๋Š”๊ฐ€?

์ด ์ธต์—์„œ๋Š” ๋ณด์•ˆ ์„ค๊ณ„๋ณด๋‹ค ์ž๋ณธ์ง€์ถœ, ๊ณต๊ธ‰๋ง, ์ „๋ ฅ๋ง, ์žฅ๋น„ ๋‚ฉ๊ธฐ, utilization, ๊ธˆ๋ฆฌ์™€ ๋ฌผ๊ฐ€ narrative๊ฐ€ ๋” ์ค‘์š”ํ•ด์ง„๋‹ค.

์™œ ๋‘˜์„ ๊ตฌ๋ถ„ํ•ด์•ผ ํ•˜๋‚˜

์ฒซ์งธ, ๊ฐ™์€ โ€œAI ํ™•์žฅโ€์ด๋ผ๋„ ํˆฌ์ž์™€ ์‚ฐ์—… ์‹ ํ˜ธ๊ฐ€ ๋‹ค๋ฅด๋‹ค. Agent runtime ์ชฝ์—์„œ๋Š” ๋ณด์•ˆ, ๊ถŒํ•œ ๊ด€๋ฆฌ, observability, developer workflow, enterprise integration์ด ์ค‘์š”ํ•˜๋‹ค. AI capex ์ชฝ์—์„œ๋Š” ๋ฐ˜๋„์ฒด, ๋ฉ”๋ชจ๋ฆฌ, ์ „๋ ฅ ์žฅ๋น„, ๋ƒ‰๊ฐ, ๋ฐ์ดํ„ฐ์„ผํ„ฐ, ๋ถ€๋™์‚ฐ, ์ž๋ณธ์žฌ๊ฐ€ ์ค‘์š”ํ•ด์ง„๋‹ค.

๋‘˜์งธ, ์œ„ํ—˜์˜ ์„ฑ๊ฒฉ์ด ๋‹ค๋ฅด๋‹ค. Agent runtime์˜ ์‹คํŒจ๋Š” ๊ถŒํ•œ ์‚ฌ๊ณ , ์ž˜๋ชป๋œ tool ์‹คํ–‰, ๊ฐ์‚ฌ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ž๋™ํ™”, stale memory ๊ฐ™์€ ์šด์˜ยท๊ฑฐ๋ฒ„๋„Œ์Šค ์œ„ํ—˜์œผ๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค. AI capex์˜ ์‹คํŒจ๋Š” ์ˆ˜์š” ๊ณผ๋Œ€ํ‰๊ฐ€, ์„ค๋น„ ๊ณผ์ž‰, ์ „๋ ฅ ๋ถ€์กฑ, ๊ณต๊ธ‰๋ง ์ง€์—ฐ, ๋น„์šฉ ๊ตฌ์กฐ ์•…ํ™”๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค.

์…‹์งธ, ์‹œ๊ฐ„์ถ•์ด ๋‹ค๋ฅด๋‹ค. Agent runtime์€ ์†Œํ”„ํŠธ์›จ์–ด ์ œํ’ˆ์ฒ˜๋Ÿผ ๋น ๋ฅด๊ฒŒ ๊ฐœ์„ ๋  ์ˆ˜ ์žˆ์ง€๋งŒ, ์‹ ๋ขฐ์™€ ์กฐ์ง ๋„์ž…์€ ๋А๋ฆด ์ˆ˜ ์žˆ๋‹ค. AI capex๋Š” ๋ฐœํ‘œ์™€ ์ฃผ๋ฌธ์€ ๋นจ๋ผ๋„ ์ „๋ ฅ๋ง, ๋ฐ์ดํ„ฐ์„ผํ„ฐ, ์žฅ๋น„ ๋‚ฉ๊ธฐ๋Š” ๋ฌผ๋ฆฌ์  ์‹œ๊ฐ„ํ‘œ๋ฅผ ๋”ฐ๋ฅธ๋‹ค. ๋‘ ํ๋ฆ„์„ ๊ฐ™์€ ์†๋„๋กœ ๊ธฐ๋Œ€ํ•˜๋ฉด ์ž˜๋ชป๋œ ๊ฒฐ๋ก ์— ๋น ์ง€๊ธฐ ์‰ฝ๋‹ค.

ํ•จ๊ป˜ ์ž‘๋™ํ•˜๋Š” ์ง€์ 

๋‘˜์€ ๋ถ„๋ฆฌ๋˜์–ด ์žˆ์ง€๋งŒ ๊ฒฐ๊ตญ ๋งŒ๋‚œ๋‹ค. Enterprise agent๊ฐ€ ์‹ค์ œ ์—…๋ฌด์— ๋“ค์–ด๊ฐ€๋ฉด ๋” ๋งŽ์€ inference ์‚ฌ์šฉ๋Ÿ‰์„ ๋งŒ๋“ค๊ณ , ์ด ์‚ฌ์šฉ๋Ÿ‰์€ AI capex cycle์„ ํ‚ค์šธ ์ˆ˜ ์žˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ inference ๋น„์šฉ์ด ๋‚ด๋ ค๊ฐ€๊ณ  ๊ณต๊ธ‰์ด ๋Š˜๋ฉด ๋” ๋งŽ์€ ์žฅ๊ธฐ ์‹คํ–‰ agent ์ œํ’ˆ์ด ๊ฒฝ์ œ์ ์œผ๋กœ ๊ฐ€๋Šฅํ•ด์งˆ ์ˆ˜ ์žˆ๋‹ค.

ํ•˜์ง€๋งŒ ์—ฐ๊ฒฐ๋œ๋‹ค๊ณ  ํ•ด์„œ ๊ฐ™์€ ๋ณ‘๋ชฉ์€ ์•„๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด agent ์ œํ’ˆ์ด ๋А๋ฆฌ๊ฑฐ๋‚˜ ๋น„์‹ธ๋‹ค๋ฉด ์ด์œ ๊ฐ€ ๋‘ ๊ฐ€์ง€์ผ ์ˆ˜ ์žˆ๋‹ค. ํ•˜๋‚˜๋Š” runtime์ด ๋น„ํšจ์œจ์ ์ด์–ด์„œ sandbox ์ค€๋น„, repository clone, session fetch, tool permission ์ฒ˜๋ฆฌ์— ์‹œ๊ฐ„์ด ๊ฑธ๋ฆฌ๋Š” ๊ฒฝ์šฐ๋‹ค. ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” inference serving ์ž์ฒด๊ฐ€ ๋น„์‹ธ๊ณ  ๋А๋ ค์„œ token ์ƒ์„ฑ ๋น„์šฉ๊ณผ latency๊ฐ€ ๋†’์€ ๊ฒฝ์šฐ๋‹ค. ์›์ธ์ด ๋‹ค๋ฅด๋ฉด ํ•ด๊ฒฐ์ฑ…๋„ ๋‹ค๋ฅด๋‹ค.

๊ทธ๋ž˜์„œ AI ์‚ฐ์—… ์‹ ํ˜ธ๋ฅผ ์ฝ์„ ๋•Œ๋Š” ๋‹ค์Œ์ฒ˜๋Ÿผ ๋‚˜๋ˆ„์–ด ๋ณด๋Š” ํŽธ์ด ์ข‹๋‹ค.

  1. ์—…๋ฌด ์‹คํ–‰ ๋ณ‘๋ชฉ์ธ๊ฐ€? ๊ถŒํ•œ, ๊ธฐ๋ก, sandbox, ์Šน์ธ, ๋ณต๊ตฌ, ๊ฐ์‚ฌ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณธ๋‹ค.
  2. ๋ชจ๋ธ ์‹คํ–‰ ๋ณ‘๋ชฉ์ธ๊ฐ€? inference serving, memory, cache, interconnect, scheduler๋ฅผ ๋ณธ๋‹ค.
  3. ๋ฌผ๋ฆฌ ์„ค๋น„ ๋ณ‘๋ชฉ์ธ๊ฐ€? ๋ฐ์ดํ„ฐ์„ผํ„ฐ, ์ „๋ ฅ, ๋ƒ‰๊ฐ, ์žฅ๋น„, ๊ณต๊ธ‰๋ง, capex๋ฅผ ๋ณธ๋‹ค.
  4. ์‹œ์žฅ narrative ๋ณ‘๋ชฉ์ธ๊ฐ€? ์‹ค์ œ ์ˆ˜์š”์™€ ๋งค์ถœ๋ณด๋‹ค ๊ธฐ๋Œ€๊ฐ€ ๋จผ์ € ์•ž์„œ๊ณ  ์žˆ๋Š”์ง€ ๋ณธ๋‹ค.

ํ—ท๊ฐˆ๋ฆฌ์ง€ ๋ง์•„์•ผ ํ•  ์ 

AI agent runtime์€ AI capex cycle์˜ ํ•˜์œ„ ๊ฐœ๋…์ด ์•„๋‹ˆ๋‹ค. Agent runtime์€ agent๋ฅผ ์–ด๋–ป๊ฒŒ ์•ˆ์ „ํ•˜๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๊ฒŒ ์šด์˜ํ• ์ง€์˜ ๋ฌธ์ œ์ด๊ณ , AI capex cycle์€ ๊ทธ ์‚ฌ์šฉ๋Ÿ‰์„ ๊ฐ๋‹นํ•˜๋Š” ๋ฌผ๋ฆฌ ์ธํ”„๋ผ์™€ ์ž๋ณธ์ง€์ถœ์˜ ๋ฌธ์ œ๋‹ค.

๋ฐ˜๋Œ€๋กœ AI capex cycle์ด ํฌ๋‹ค๊ณ  ํ•ด์„œ agent ์ œํ’ˆ์ด ์ž๋™์œผ๋กœ ์„ฑ๊ณตํ•˜๋Š” ๊ฒƒ๋„ ์•„๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์„ผํ„ฐ๊ฐ€ ์ถฉ๋ถ„ํ•ด๋„ agent๊ฐ€ ๊ถŒํ•œยท๊ธฐ๋กยท๊ฐ์‚ฌ ๊ฐ€๋Šฅ์„ฑ์„ ๊ฐ–์ถ”์ง€ ๋ชปํ•˜๋ฉด ํ•ต์‹ฌ ์—…๋ฌด์— ๋“ค์–ด๊ฐ€๊ธฐ ์–ด๋ ต๋‹ค.

๋˜ํ•œ โ€œAI ์ธํ”„๋ผโ€๋ผ๋Š” ๋ง์€ ๋„ˆ๋ฌด ๋„“๋‹ค. ์–ด๋–ค ๊ธ€์—์„œ๋Š” sandbox์™€ session log ๊ฐ™์€ software runtime์„ ๋œปํ•˜๊ณ , ๋‹ค๋ฅธ ๊ธ€์—์„œ๋Š” GPU, HBM, ์ „๋ ฅ๋ง, ๋ฐ์ดํ„ฐ์„ผํ„ฐ๋ฅผ ๋œปํ•œ๋‹ค. ๋ฌธ๋งฅ๋งˆ๋‹ค ์–ด๋А ์ธต์˜ ์ธํ”„๋ผ๋ฅผ ๋งํ•˜๋Š”์ง€ ๋จผ์ € ํ™•์ธํ•ด์•ผ ํ•œ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ ์ด ๊ธ€์€ ํˆฌ์ž ์กฐ์–ธ์ด ์•„๋‹ˆ๋‹ค. ๋ชฉ์ ์€ โ€œAI ํ™•์žฅโ€์ด๋ผ๋Š” ํฐ ๋ง์„ ๋‘ ๋ณ‘๋ชฉ์œผ๋กœ ๋‚˜๋ˆ„์–ด, ์–ด๋–ค source๋ฅผ ์ฝ์„ ๋•Œ ์–ด๋–ค ์งˆ๋ฌธ์„ ํ•ด์•ผ ํ•˜๋Š”์ง€ ๋ถ„๋ช…ํžˆ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

๊ด€๋ จ ๋ฌธ์„œ