AI๊ฐ ์ปค์ง๋ค๋ ๋ง์ ํ๋๋ก ๋ค๋ฆฌ์ง๋ง, ์ค์ ๋ณ๋ชฉ์ ์๋ก ๋ค๋ฅธ ๋ ์ธต์์ ์๊ธด๋ค. ํ๋๋ AI agent๋ฅผ ์ค๋, ์์ ํ๊ฒ, ๋ณต๊ตฌ ๊ฐ๋ฅํ๊ฒ ์คํํ๋ runtime ๋ฌธ์ ์ด๊ณ , ๋ค๋ฅธ ํ๋๋ AI ์ฌ์ฉ๋์ ์ฒ๋ฆฌํ๊ธฐ ์ํด ๋ฐ์ดํฐ์ผํฐยท์นฉยท์ ๋ ฅยท์ฅ๋น ํฌ์๊ฐ ์ปค์ง๋ capex cycle ๋ฌธ์ ๋ค.
๋ ํ๋ฆ์ ์ฐ๊ฒฐ๋์ด ์์ง๋ง ๊ฐ์ ๋ฌธ์ ๊ฐ ์๋๋ค. ์ ์๋ agent๊ฐ ์ค์ ์ ๋ฌด ๋๊ตฌ๋ฅผ ๋ง์ง ๋ โ์ด๋ป๊ฒ ํต์ ํ๊ณ ๊ธฐ๋กํ๊ณ ์ฌ์์ํ ๊ฒ์ธ๊ฐโ๋ฅผ ๋ฌป๋๋ค. ํ์๋ inference ์์๊ฐ ๋์ด๋ ๋ โ์ผ๋ง๋ ๋ง์ ๋ฌผ๋ฆฌ ์ธํ๋ผ๋ฅผ ์ง์ด์ผ ํ๊ณ , ๊ทธ ๋น์ฉ๊ณผ ๋ณ๋ชฉ์ด ์ด๋๋ก ๋ฒ์ง๋๊ฐโ๋ฅผ ๋ฌป๋๋ค.
ํ ์ค๋ก ๋งํ๋ฉด
AI agent runtime์ AI๊ฐ ์ผ์ ๋งก์ ๋ ์์ ํ๊ฒ ์ค๋ ๊ตด๋ฌ๊ฐ๊ฒ ํ๋ ์ด์ ๊ตฌ์กฐ์ด๊ณ , AI capex cycle์ AI ์ฌ์ฉ๋์ด ๋ฌผ๋ฆฌ ์ธํ๋ผ ํฌ์์ ์์ฅ narrative๋ก ๋ฒ์ง๋ ๊ตฌ์กฐ๋ค.
๋น์ ๋ก ์ดํดํ๊ธฐ
AI agent runtime์ ํ์ฌ์ ์ ๋ฌด ์ด์ ์์คํ ์ ๊ฐ๊น๋ค. ์ง์์๊ฒ ์ผ์ ๋งก๊ธฐ๋ ค๋ฉด ์ฑ ์, ๋ฌธ์ํจ, ๊ถํ, ์น์ธ ์ ์ฐจ, ์์ ๊ธฐ๋ก, ์ฌ๊ณ ๋์ ๋ฐฉ์์ด ์์ด์ผ ํ๋ค. ์ง์์ด ๋๋ํ๋๋ผ๋ ์ถ์ ์ฆ์ ์๋ฌด ๋ฐ๋ ์ด ์ ์๊ฒ ๋๊ฑฐ๋, ์์ ๊ธฐ๋ก์ด ์ฌ๋ผ์ง๊ฑฐ๋, ๋ฌธ์ ๊ฐ ์๊ฒผ์ ๋ ์ด๋์ ๋ค์ ์์ํ ์ง ๋ชจ๋ฅด๋ฉด ์ค์ ์ ๋ฌด๋ฅผ ๋งก๊ธฐ๊ธฐ ์ด๋ ต๋ค.
AI capex cycle์ ๊ณต์ฅ๊ณผ ์ ๋ ฅ๋ง์ ๊ฐ๊น๋ค. ์ฃผ๋ฌธ์ด ๋๋ฉด ๊ณต์ฅ์ ๋ ์ง๊ณ , ์ฅ๋น๋ฅผ ์ฌ๊ณ , ์ ๊ธฐ๋ฅผ ๋์ด์ค๊ณ , ๋๊ฐ๊ณผ ๋ฌผ๋ฅ๋ฅผ ๋ง์ถฐ์ผ ํ๋ค. ์ฃผ๋ฌธ์ ๋ฐ๋ ์ํํธ์จ์ด๊ฐ ์ข์๋ ์์ฐ ์ค๋น๊ฐ ๋ถ์กฑํ๋ฉด ๋ฉ๊ธฐ๊ฐ ๋ฐ๋ฆฌ๊ณ ๋น์ฉ์ด ์ฌ๋ผ๊ฐ๋ค.
์ด ๋น์ ์์ ์ค์ํ ์ ์ ๋์ ๋ณ๋ชฉ์ด ๋ค๋ฅด๋ค๋ ๊ฒ์ด๋ค. ์ ๋ฌด ์ด์ ์์คํ ์ ๊ถํยท๊ธฐ๋กยท๋ณต๊ตฌยท๊ฐ์ฌ ๊ฐ๋ฅ์ฑ์ด ํต์ฌ์ด๊ณ , ๊ณต์ฅยท์ ๋ ฅ๋ง์ ์ค๋น ํฌ์ยท๊ณต๊ธ๋งยท์ ๋ ฅยท๋๊ฐยท์๋ณธ ๋น์ฉ์ด ํต์ฌ์ด๋ค.
๋น๊ต ํ
| ๊ตฌ๋ถ | AI agent runtime | AI capex cycle |
|---|---|---|
| ํต์ฌ ์ง๋ฌธ | agent๊ฐ ์ค์ ์ผ์ ์์ ํ๊ฒ ์ค๋ ์ํํ ์ ์๋๊ฐ | AI ์ฌ์ฉ๋์ ์ฒ๋ฆฌํ ๋ฌผ๋ฆฌ ์ธํ๋ผ๊ฐ ์ถฉ๋ถํ๊ฐ |
| ๋ํ ๊ฐ๋ | [[Concepts/managed-agents | Managed agents]], [[Concepts/loop-engineering |
| ์ฃผ์ ๋ณ๋ชฉ | session log, sandbox, credential boundary, tool permission, audit trail | GPU/AI accelerator, [[Concepts/hbm |
| ์คํจ ์์ | ๊ถํ ๋ ธ์ถ, context ์์ค, ๋ฉ์ถ์ง ์๋ loop, ๋ณต๊ตฌ ๋ถ๊ฐ, ๊ฐ์ฌ ๋ถ๊ฐ๋ฅ | ๊ณผ์ํฌ์, ์ ๋ ฅ ๋ถ์กฑ, ๊ณต๊ธ๋ง ๋ณ๋ชฉ, [[Concepts/cost-per-token |
| ๋ด์ผ ํ ์งํ | tool call ๊ธฐ๋ก, ๊ถํ ๋ถ๋ฆฌ, ์ฌ์์ ๊ฐ๋ฅ์ฑ, ์น์ธ/๊ฐ์ฌ ์ ์ฐจ | capex ๊ณํ, ์ ๋ ฅ ๊ณ์ฝ, rack density, utilization, [[Concepts/cost-per-token |
| ์ฐ์ ์ง๋ฌธ | ์ด๋ค ์ ํ์ด enterprise ์ ๋ฌด์ ๋ค์ด๊ฐ ์ ์๋๊ฐ | ์ด๋ค ๊ธฐ์ ๊ณผ ๊ณต๊ธ๋ง์ด AI ์ธํ๋ผ ์ง์ถ์ ๋ณ๋ชฉ์ ์๋๊ฐ |
AI agent runtime์ โ์ผ์ ๋งก๊ธฐ๋ ๊ตฌ์กฐโ์ ๋ฌธ์ ๋ค
Managed agents๋ ๋ชจ๋ธ, ์คํ ํ๊ฒฝ, session ๊ธฐ๋ก์ ๋ถ๋ฆฌํด ์ฅ๊ธฐ ์คํ agent๋ฅผ ๋ ์์ ์ ์ผ๋ก ๋ง๋ค๋ ค๋ ๊ตฌ์กฐ๋ค. Anthropic์ด ๋งํ brainยทhandsยทsession ๊ตฌ๋ถ์ ์ด ์ธต์ ๋ฌธ์ ๋ฅผ ์ ๋ณด์ฌ์ค๋ค. ๋ชจ๋ธ์ด ๋ค์ ํ๋์ ์ ํ๋ ๋ถ๋ถ๊ณผ ์ฝ๋ ์คํยท๋๊ตฌ ํธ์ถ์ด ์ผ์ด๋๋ ๋ถ๋ถ, ๊ทธ๋ฆฌ๊ณ ์์ ๊ธฐ๋ก์ ๋ณด์กดํ๋ ๋ถ๋ถ์ ๋๋์ด์ผ ์ฅ์ ์ ๋ณด์ ๋ฌธ์ ๋ฅผ ๊ฒฌ๋๊ธฐ ์ฝ๋ค.
Loop engineering๋ ๊ฐ์ ๋ฐฉํฅ์ ๊ฐ๋ฆฌํจ๋ค. agent๋ฅผ ํ๋กฌํํธ ํ ๋ฒ์ผ๋ก ๋๋๋ ๋ต๋ณ๊ธฐ๊ฐ ์๋๋ผ, queue, retry, verifier, state, observability๊ฐ ์๋ ์คํ ์์คํ ์ผ๋ก ๋ณด์๋ ๊ด์ ์ด๋ค. ์ด๋ ํต์ฌ์ โ๋ ์ค๋ ๋๋ฆฐ๋คโ๊ฐ ์๋๋ผ โ์คํจํด๋ ๋ฉ์ถ๊ณ , ๊ธฐ๋กํ๊ณ , ๋ค์ ์์ํ๊ณ , ๊ถํ์ ๋์ง ์๊ฒ ๋ง๋ ๋คโ์ด๋ค.
๊ทธ๋์ agent runtime์ ๋ณผ ๋๋ ๋ชจ๋ธ ์ด๋ฆ๋ณด๋ค ๋ค์ ์ง๋ฌธ์ด ๋ ์ค์ํด์ง ์ ์๋ค.
- session log๊ฐ context window ๋ฐ์ durableํ๊ฒ ๋จ๋๊ฐ?
- sandbox์ credential์ด ๋ถ๋ฆฌ๋์ด ์๋๊ฐ?
- agent๊ฐ ์ด๋ค tool์ ์ด๋ค ๊ถํ์ผ๋ก ํธ์ถํ๋์ง ์ถ์ ๊ฐ๋ฅํ๊ฐ?
- ์คํจํ harness๋ ์คํ ํ๊ฒฝ์ ๊ต์ฒดํ๊ณ ์ด์ด๊ฐ ์ ์๋๊ฐ?
- ์ค์ํ ํ๋์๋ ์ฌ๋ ์น์ธ ๋๋ ์ ์ฑ ๊ธฐ๋ฐ ์ ํ์ด ๋ค์ด๊ฐ๋๊ฐ?
์ด ์ง๋ฌธ๋ค์ Agent containment์ AI ์์คํ ์ ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ์ผ๋ก ์ด์ด์ง๋ค. agent๊ฐ ์ค์ ํ์ผ, ์ฝ๋, ์ ๋ฌด ๋๊ตฌ, ์ธ๋ถ API๋ฅผ ๋ง์ง์๋ก โ๋๋ํ๊ฐโ๋ณด๋ค โํผํด ๋ฒ์๊ฐ ์ ํ๋์ด ์๋๊ฐโ์ โ๋์ค์ ์ค๋ช ํ ์ ์๋๊ฐโ๊ฐ ์ฑํ์ ์กฐ๊ฑด์ด ๋๋ค.
AI capex cycle์ โAI ์ฌ์ฉ๋์ ๊ฐ๋นํ๋ ์ค๋นโ์ ๋ฌธ์ ๋ค
๋ฐ๋๋ก AI capex cycle์ agent๊ฐ ์ด๋ค ์ผ์ ๋งก๋์ง๋ณด๋ค, ๊ทธ ์ผ์ ์ฒ๋ฆฌํ๋ ๋ฐ ํ์ํ ๋ฌผ๋ฆฌ ์ธํ๋ผ๊ฐ ์ด๋ป๊ฒ ์ปค์ง๋์ง๋ฅผ ๋ณธ๋ค. AI ์๋น์ค ์ฌ์ฉ๋์ด ๋๋ฉด inference ์์ฒญ์ด ๋๊ณ , inference ์์ฒญ์ chip, memory, networking, ์ ๋ ฅ, ๋๊ฐ, rack, ๊ฑด์ค, ์ ๋ ฅ ์ฅ๋น ์์๋ก ์ฐ๊ฒฐ๋๋ค.
LLM inference serving์์ ์ค์ํ ์ ์ ํ์ต์ด ๋๋ ๋ชจ๋ธ๋ ์ค์ ์ ํ์์๋ ๋งค ์์ฒญ๋ง๋ค ๊ณ์ ์คํ๋๋ค๋ ๊ฒ์ด๋ค. ์ฌ์ฉ์๊ฐ ๋๋ฉด cost per token, latency, memory bandwidth, KV cache, interconnect, scheduler, power per rack์ด ์์ต์ฑ๊ณผ ์ฌ์ฉ์ ๊ฒฝํ์ ๋ฐ๊พผ๋ค.
Etched์ rack-scale inference system ์ธํฐ๋ทฐ๊ฐ ๋จ์ผ chip ์ฑ๋ฅ๋ณด๋ค rack ๋จ์ memory์ interconnect๋ฅผ ๊ฐ์กฐํ ๊ฒ๋ ์ด ๋ฌธ์ ์ ๋ง๋ฟ์ ์๋ค. ํ์ฌ์ ์ฃผ์ฅ์ด ๊ฒ์ฆ๋๋ค๋ ๋ป์ ์๋์ง๋ง, inference ๊ฒฝ์์ด chip ํ๋์ benchmark๋ฅผ ๋์ด serving economics์ ๋ฌผ๋ฆฌ ์์คํ ์ค๊ณ๋ก ๋์ด์ง๋ค๋ ์ ํธ๋ก ์ฝ์ ์ ์๋ค.
AI capex cycle์ ๋ณผ ๋ ํ์ํ ์ง๋ฌธ์ ๋ค์์ ๊ฐ๊น๋ค.
- AI ์ฌ์ฉ๋ ์ฆ๊ฐ๊ฐ ์ค์ compute ์์์ ๋งค์ถ๋ก ์ด์ด์ง๋๊ฐ?
- ๋ฐ์ดํฐ์ผํฐ ์ ๋ ฅยท๋๊ฐยท๋ถ์งยท๋ณ์๊ธฐยทswitchgear๊ฐ ๋ณ๋ชฉ์ด ๋๋๊ฐ?
- memory, networking, advanced packaging ๊ฐ์ ๊ณต๊ธ๋ง์ด ์ถฉ๋ถํ๊ฐ?
- cost per token์ด ๋ด๋ ค๊ฐ๊ณ ์๋๊ฐ, ์๋๋ฉด capex ๋ถ๋ด์ด ๋ ๋นจ๋ฆฌ ์ปค์ง๋๊ฐ?
- ์ค๋น ํฌ์๊ฐ ๊ณผ์ํฌ์๋ก ๋ฐ๋ ์ํ์ ์๋๊ฐ?
์ด ์ธต์์๋ ๋ณด์ ์ค๊ณ๋ณด๋ค ์๋ณธ์ง์ถ, ๊ณต๊ธ๋ง, ์ ๋ ฅ๋ง, ์ฅ๋น ๋ฉ๊ธฐ, utilization, ๊ธ๋ฆฌ์ ๋ฌผ๊ฐ narrative๊ฐ ๋ ์ค์ํด์ง๋ค.
์ ๋์ ๊ตฌ๋ถํด์ผ ํ๋
์ฒซ์งธ, ๊ฐ์ โAI ํ์ฅโ์ด๋ผ๋ ํฌ์์ ์ฐ์ ์ ํธ๊ฐ ๋ค๋ฅด๋ค. Agent runtime ์ชฝ์์๋ ๋ณด์, ๊ถํ ๊ด๋ฆฌ, observability, developer workflow, enterprise integration์ด ์ค์ํ๋ค. AI capex ์ชฝ์์๋ ๋ฐ๋์ฒด, ๋ฉ๋ชจ๋ฆฌ, ์ ๋ ฅ ์ฅ๋น, ๋๊ฐ, ๋ฐ์ดํฐ์ผํฐ, ๋ถ๋์ฐ, ์๋ณธ์ฌ๊ฐ ์ค์ํด์ง๋ค.
๋์งธ, ์ํ์ ์ฑ๊ฒฉ์ด ๋ค๋ฅด๋ค. Agent runtime์ ์คํจ๋ ๊ถํ ์ฌ๊ณ , ์๋ชป๋ tool ์คํ, ๊ฐ์ฌ ๋ถ๊ฐ๋ฅํ ์๋ํ, stale memory ๊ฐ์ ์ด์ยท๊ฑฐ๋ฒ๋์ค ์ํ์ผ๋ก ๋ํ๋๋ค. AI capex์ ์คํจ๋ ์์ ๊ณผ๋ํ๊ฐ, ์ค๋น ๊ณผ์, ์ ๋ ฅ ๋ถ์กฑ, ๊ณต๊ธ๋ง ์ง์ฐ, ๋น์ฉ ๊ตฌ์กฐ ์ ํ๋ก ๋ํ๋๋ค.
์ ์งธ, ์๊ฐ์ถ์ด ๋ค๋ฅด๋ค. Agent runtime์ ์ํํธ์จ์ด ์ ํ์ฒ๋ผ ๋น ๋ฅด๊ฒ ๊ฐ์ ๋ ์ ์์ง๋ง, ์ ๋ขฐ์ ์กฐ์ง ๋์ ์ ๋๋ฆด ์ ์๋ค. AI capex๋ ๋ฐํ์ ์ฃผ๋ฌธ์ ๋นจ๋ผ๋ ์ ๋ ฅ๋ง, ๋ฐ์ดํฐ์ผํฐ, ์ฅ๋น ๋ฉ๊ธฐ๋ ๋ฌผ๋ฆฌ์ ์๊ฐํ๋ฅผ ๋ฐ๋ฅธ๋ค. ๋ ํ๋ฆ์ ๊ฐ์ ์๋๋ก ๊ธฐ๋ํ๋ฉด ์๋ชป๋ ๊ฒฐ๋ก ์ ๋น ์ง๊ธฐ ์ฝ๋ค.
ํจ๊ป ์๋ํ๋ ์ง์
๋์ ๋ถ๋ฆฌ๋์ด ์์ง๋ง ๊ฒฐ๊ตญ ๋ง๋๋ค. Enterprise agent๊ฐ ์ค์ ์ ๋ฌด์ ๋ค์ด๊ฐ๋ฉด ๋ ๋ง์ inference ์ฌ์ฉ๋์ ๋ง๋ค๊ณ , ์ด ์ฌ์ฉ๋์ AI capex cycle์ ํค์ธ ์ ์๋ค. ๋ฐ๋๋ก inference ๋น์ฉ์ด ๋ด๋ ค๊ฐ๊ณ ๊ณต๊ธ์ด ๋๋ฉด ๋ ๋ง์ ์ฅ๊ธฐ ์คํ agent ์ ํ์ด ๊ฒฝ์ ์ ์ผ๋ก ๊ฐ๋ฅํด์ง ์ ์๋ค.
ํ์ง๋ง ์ฐ๊ฒฐ๋๋ค๊ณ ํด์ ๊ฐ์ ๋ณ๋ชฉ์ ์๋๋ค. ์๋ฅผ ๋ค์ด agent ์ ํ์ด ๋๋ฆฌ๊ฑฐ๋ ๋น์ธ๋ค๋ฉด ์ด์ ๊ฐ ๋ ๊ฐ์ง์ผ ์ ์๋ค. ํ๋๋ runtime์ด ๋นํจ์จ์ ์ด์ด์ sandbox ์ค๋น, repository clone, session fetch, tool permission ์ฒ๋ฆฌ์ ์๊ฐ์ด ๊ฑธ๋ฆฌ๋ ๊ฒฝ์ฐ๋ค. ๋ค๋ฅธ ํ๋๋ inference serving ์์ฒด๊ฐ ๋น์ธ๊ณ ๋๋ ค์ token ์์ฑ ๋น์ฉ๊ณผ latency๊ฐ ๋์ ๊ฒฝ์ฐ๋ค. ์์ธ์ด ๋ค๋ฅด๋ฉด ํด๊ฒฐ์ฑ ๋ ๋ค๋ฅด๋ค.
๊ทธ๋์ AI ์ฐ์ ์ ํธ๋ฅผ ์ฝ์ ๋๋ ๋ค์์ฒ๋ผ ๋๋์ด ๋ณด๋ ํธ์ด ์ข๋ค.
- ์ ๋ฌด ์คํ ๋ณ๋ชฉ์ธ๊ฐ? ๊ถํ, ๊ธฐ๋ก, sandbox, ์น์ธ, ๋ณต๊ตฌ, ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ์ ๋ณธ๋ค.
- ๋ชจ๋ธ ์คํ ๋ณ๋ชฉ์ธ๊ฐ? inference serving, memory, cache, interconnect, scheduler๋ฅผ ๋ณธ๋ค.
- ๋ฌผ๋ฆฌ ์ค๋น ๋ณ๋ชฉ์ธ๊ฐ? ๋ฐ์ดํฐ์ผํฐ, ์ ๋ ฅ, ๋๊ฐ, ์ฅ๋น, ๊ณต๊ธ๋ง, capex๋ฅผ ๋ณธ๋ค.
- ์์ฅ narrative ๋ณ๋ชฉ์ธ๊ฐ? ์ค์ ์์์ ๋งค์ถ๋ณด๋ค ๊ธฐ๋๊ฐ ๋จผ์ ์์๊ณ ์๋์ง ๋ณธ๋ค.
ํท๊ฐ๋ฆฌ์ง ๋ง์์ผ ํ ์
AI agent runtime์ AI capex cycle์ ํ์ ๊ฐ๋ ์ด ์๋๋ค. Agent runtime์ agent๋ฅผ ์ด๋ป๊ฒ ์์ ํ๊ณ ์ ๋ขฐํ ์ ์๊ฒ ์ด์ํ ์ง์ ๋ฌธ์ ์ด๊ณ , AI capex cycle์ ๊ทธ ์ฌ์ฉ๋์ ๊ฐ๋นํ๋ ๋ฌผ๋ฆฌ ์ธํ๋ผ์ ์๋ณธ์ง์ถ์ ๋ฌธ์ ๋ค.
๋ฐ๋๋ก AI capex cycle์ด ํฌ๋ค๊ณ ํด์ agent ์ ํ์ด ์๋์ผ๋ก ์ฑ๊ณตํ๋ ๊ฒ๋ ์๋๋ค. ๋ฐ์ดํฐ์ผํฐ๊ฐ ์ถฉ๋ถํด๋ agent๊ฐ ๊ถํยท๊ธฐ๋กยท๊ฐ์ฌ ๊ฐ๋ฅ์ฑ์ ๊ฐ์ถ์ง ๋ชปํ๋ฉด ํต์ฌ ์ ๋ฌด์ ๋ค์ด๊ฐ๊ธฐ ์ด๋ ต๋ค.
๋ํ โAI ์ธํ๋ผโ๋ผ๋ ๋ง์ ๋๋ฌด ๋๋ค. ์ด๋ค ๊ธ์์๋ sandbox์ session log ๊ฐ์ software runtime์ ๋ปํ๊ณ , ๋ค๋ฅธ ๊ธ์์๋ GPU, HBM, ์ ๋ ฅ๋ง, ๋ฐ์ดํฐ์ผํฐ๋ฅผ ๋ปํ๋ค. ๋ฌธ๋งฅ๋ง๋ค ์ด๋ ์ธต์ ์ธํ๋ผ๋ฅผ ๋งํ๋์ง ๋จผ์ ํ์ธํด์ผ ํ๋ค.
๋ง์ง๋ง์ผ๋ก ์ด ๊ธ์ ํฌ์ ์กฐ์ธ์ด ์๋๋ค. ๋ชฉ์ ์ โAI ํ์ฅโ์ด๋ผ๋ ํฐ ๋ง์ ๋ ๋ณ๋ชฉ์ผ๋ก ๋๋์ด, ์ด๋ค source๋ฅผ ์ฝ์ ๋ ์ด๋ค ์ง๋ฌธ์ ํด์ผ ํ๋์ง ๋ถ๋ช ํ ํ๋ ๊ฒ์ด๋ค.