Hybrid AI compute๋ AI workload๋ฅผ ํ๋์ ๊ฑฐ๋ํ ํด๋ผ์ฐ๋์๋ง ๋ชฐ์๋ฃ์ง ์๊ณ , ํด๋ผ์ฐ๋ยท์ฌ๋ด ๋ฐ์ดํฐ์ผํฐยท์ํฌ์คํ ์ด์ ยท์ฃ์ง ์ฅ๋น๋ฅผ ์ ๋ฌด ์ฑ๊ฒฉ์ ๋ง๊ฒ ๋๋ ์ฐ๋ ๊ณ์ฐ ๊ตฌ์กฐ๋ค. HP์ Z Workstations์ Z Boost ๋ฐํ์ฒ๋ผ, AI ์ธํ๋ผ ๋ ผ์๊ฐ ๋ฐ์ดํฐ์ผํฐ GPU์์ ์ง์์ด ์ฐ๋ ๊ณ ์ฑ๋ฅ ์ฅ๋น์ ์ฌ๋ด ์ด์ ์ฒด๊ณ๊น์ง ๋ด๋ ค์ฌ ๋ ์ด ๊ฐ๋ ์ด ์ค์ํด์ง๋ค.
ํ ์ค๋ก ๋งํ๋ฉด
Hybrid AI compute๋ AI ๊ณ์ฐ์ โ์ด๋์ ๋๋ฆด ๊ฒ์ธ๊ฐโ๋ฅผ ๋น์ฉ, ์ง์ฐ ์๊ฐ, ๋ฐ์ดํฐ ๋ณด์, ์ฅ๋น ํ์ฉ๋ฅ ์ ๋ง์ถฐ ํด๋ผ์ฐ๋์ ๋ก์ปฌ ์ฅ๋น ์ฌ์ด์ ๋ฐฐ์นํ๋ ๋ฐฉ์์ด๋ค.
๋น์ ๋ก ์ดํดํ๊ธฐ
๋ชจ๋ ์ง์ ์ค์ ๋ฌผ๋ฅ์ฐฝ๊ณ ๋ก๋ง ๋ณด๋ด๋ฉด ํฐ ๋ฌผ๋์ ์ฒ๋ฆฌํ๊ธฐ๋ ์ข๋ค. ํ์ง๋ง ๋๋ค์์ ๋ฐ๋ก ์ฒ๋ฆฌํด์ผ ํ๋ ๋น ๋ฅธ ๋ฐฐ์ก, ๋ฏผ๊ฐํ ๋ฌผ๊ฑด, ์์ฃผ ์ค๊ฐ๋ ์๋ ์์ ๊น์ง ์ ๋ถ ์ค์ ์ฐฝ๊ณ ๋ก ๋ณด๋ด๋ฉด ์คํ๋ ค ๋น์ธ๊ณ ๋๋ ค์ง ์ ์๋ค.
AI compute๋ ๋น์ทํ๋ค. ๋ํ ๋ชจ๋ธ ํ์ต์ด๋ ๊ฑฐ๋ํ batch inference๋ ํด๋ผ์ฐ๋ยท๋ฐ์ดํฐ์ผํฐ๊ฐ ์์ฐ์ค๋ฝ๋ค. ๋ฐ๋๋ก ์ ํ ์ค๊ณ ํ์ผ, ์์ ๋ ๋๋ง, ์ฌ๋ด ๊ธฐ๋ฐ ๋ฐ์ดํฐ, ์ง์ฐ ์๊ฐ์ด ์ค์ํ ์ถ๋ก , ๊ฐ๋ฐ์์ ์คํ workload๋ ์ํฌ์คํ ์ด์ ์ด๋ ์ฌ๋ด ์ฅ๋น์์ ์ฒ๋ฆฌํ๋ ํธ์ด ๋ ๋ซ๊ฑฐ๋ ๋ ์์ ํ ์ ์๋ค.
๋น์ ์ ํ๊ณ๋ ์๋ค. AI workload๋ ๋จ์ํ ํ๋ฐฐ๊ฐ ์๋๋ผ ๋ชจ๋ธ, ๋ฐ์ดํฐ, GPU ๋ฉ๋ชจ๋ฆฌ, ๋คํธ์ํฌ, ๋๋ผ์ด๋ฒ, ๋ณด์ ์ ์ฑ , ๋ก๊ทธ ๊ด๋ฆฌ๊ฐ ํจ๊ป ์์ง์ธ๋ค. ๊ทธ๋์ โ๊ฐ๊น์ด ๊ณณ์์ ๋๋ฆฌ๋ฉด ๋๋คโ๊ฐ ์๋๋ผ, ์ด๋ ๊ณ์ฐ์ ์ด๋ ํ๊ฒฝ์ ๋์ง ์ด์ ๋ชจ๋ธ๊น์ง ๊ฐ์ด ์ค๊ณํด์ผ ํ๋ค.
์ ํํ ์ ์
Hybrid AI compute๋ AI ์ ๋ฌด๋ฅผ ๋จ์ผ ์คํ ์ฅ์์ ๊ณ ์ ํ์ง ์๊ณ , workload์ ํน์ฑ์ ๋ฐ๋ผ ์ฌ๋ฌ compute layer์ ๋ฐฐ์นํ๋ ์ํคํ ์ฒ๋ค.
| ์คํ ์์น | ์ ๋ง๋ ์ ๋ฌด | ์ฃผ์ ์ง๋ฌธ |
|---|---|---|
| ๋ํ ํด๋ผ์ฐ๋ยท๋ฐ์ดํฐ์ผํฐ | ๋๊ท๋ชจ ํ์ต, ๋๋ ์ถ๋ก , ํ๋ ฅ์ GPU ์์ | ๋น์ฉ, ์ ๋ ฅ, GPU ๊ณต๊ธ, ๋ฐ์ดํฐ ์ด๋ ๋น์ฉ |
| ์ฌ๋ด ๋ฐ์ดํฐ์ผํฐ | ๊ท์ ์ฐ์ , ๋ฏผ๊ฐ ๋ฐ์ดํฐ, ๋ด๋ถ ์์คํ ํตํฉ | ๋ณด์, ์ด์ ์ธ๋ ฅ, ์ฅ๋น ํฌ์, ๊ฐ์ฌ ๊ธฐ๋ก |
| ์ํฌ์คํ ์ด์ ยทAI station | ์ค๊ณ, ๋ ๋๋ง, ์๋ฎฌ๋ ์ด์ , ๊ฐ๋ฐ์ ์คํ, ๋ก์ปฌ fine-tuning | GPU ํ์ฉ๋ฅ , ์ฅ๋น ๊ณต์ , ์ํํธ์จ์ด ๊ด๋ฆฌ |
| ์ฃ์งยทendpoint | ์ง์ฐ ์๊ฐ์ด ์ค์ํ ์ถ๋ก , ํ์ฅ ์ฅ๋น, ์คํ๋ผ์ธ ํ๊ฒฝ | ์ ๋ฐ์ดํธ, ๋ณด์, ๋ชจ๋ธ ๊ฒฝ๋ํ, ์ฅ์ ๋์ |
์ด ๊ฐ๋ ์ AI capex cycle์ ๋ ๋๊ฒ ๋ณด๊ฒ ํ๋ค. AI ํฌ์๋ ๋ฐ์ดํฐ์ผํฐ GPU๋ง์ด ์๋๋ผ workstation, edge accelerator, device management, endpoint ๋ณด์, ๋ก์ปฌ inference ์ด์๊น์ง ํผ์ง ์ ์๋ค.
์ ์ค์ํ๊ฐ
1. AI ์ธํ๋ผ ๋น์ฉ์ ๋จ์๊ฐ ๋์ด์ง๋ค
AI capex๋ฅผ ๋ฐ์ดํฐ์ผํฐ์ ํด๋ผ์ฐ๋ GPU๋ง์ผ๋ก ๋ณด๋ฉด ์ผ๋ถ๋ง ๋ณด๊ฒ ๋๋ค. ๊ธฐ์ ์ด AI workflow๋ฅผ ์ค์ ์ ๋ฌด์ ๋ฃ๊ธฐ ์์ํ๋ฉด, ๊ฐ๋ฐ์ ์ฅ๋น, ๋ณด์์ด ํ์ํ ์ฌ๋ด ์ฅ๋น, ํ์ฅ inference ์ฅ์น, ์ฅ๋น ๊ณต์ ์ํํธ์จ์ด๋ ํฌ์ ๋์์ด ๋๋ค.
HP Z Workstations์ Z Boost ๋ฐํ๋ ์ด ์ ํธ๋ฅผ ๋ณด์ฌ์ค๋ค. HP๋ ๊ณ ์ฑ๋ฅ workstation์ AI development, rendering, simulation, inference, fine-tuning ์ ๋ฌด์ ์ฐ๊ฒฐํ๊ณ , Z Boost๋ฅผ ํตํด ๋ก์ปฌ GPU๋ฅผ shared resource์ฒ๋ผ ์ฐ๋ ๊ทธ๋ฆผ์ ์ ์ํ๋ค.
2. ๋ฐ์ดํฐ ์์น์ ์ง์ฐ ์๊ฐ์ด ๊ธฐ์ ์ ํ์ ๋ฐ๊พผ๋ค
๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ํด๋ผ์ฐ๋๋ก ์ฌ๋ฆฌ๋ ๊ฒ์ด ํญ์ ์ต์ ์ ์๋๋ค. ์๋ฃยท๊ธ์ตยท์ ์กฐ ์ค๊ณยท๋ณด์ ์ ๋ฌด์ฒ๋ผ ๋ฏผ๊ฐํ ๋ฐ์ดํฐ๊ฐ ์๋ ๊ฒฝ์ฐ, ๋ก์ปฌ ์คํ์ด๋ ์ฌ๋ด ์คํ์ด ๋ ์์ฐ์ค๋ฌ์ธ ์ ์๋ค. ์ค์๊ฐ ๋ฐ์์ด ์ค์ํ ์ ๋ฌด๋ ๋คํธ์ํฌ ์ง์ฐ ์๊ฐ๊ณผ ์ฅ์ ๊ฐ๋ฅ์ฑ์ ๊ณ ๋ คํด์ผ ํ๋ค.
๊ทธ๋์ hybrid AI compute๋ ๋จ์ํ ์ฅ๋น ์ ํ์ด ์๋๋ผ enterprise AI operating model์ ์ผ๋ถ๋ค. ๊ธฐ์ ์ ์ด๋ค workflow๋ฅผ ์ด๋์ ์คํํ๊ณ , ์ด๋ค ๋ก๊ทธ๋ฅผ ๋จ๊ธฐ๋ฉฐ, ์ด๋ค ๋ณด์ ์ ์ฑ ์ ์ ์ฉํ ์ง ํจ๊ป ์ ํด์ผ ํ๋ค.
3. ํด๋ผ์ฐ๋์ ๋ก์ปฌ์ ๋์ฒด ๊ด๊ณ๋ง์ ์๋๋ค
๋ก์ปฌ ์ฅ๋น๊ฐ ๊ฐํด์ง๋ค๊ณ ํด์ ํด๋ผ์ฐ๋๊ฐ ์ฌ๋ผ์ง๋ ๊ฒ์ ์๋๋ค. ๋ ํ์ค์ ์ธ ๊ทธ๋ฆผ์ cloud burst, ์ฌ๋ด ๋ณด์ workload, workstation ์คํ, endpoint inference๊ฐ ํจ๊ป ์ฐ์ด๋ ๊ตฌ์กฐ๋ค. ํฐ ํ์ต์ ํด๋ผ์ฐ๋์์ ํ๊ณ , ๋ฏผ๊ฐํ ๋ถ์์ ์ฌ๋ด์์ ํ๊ณ , ๋์์ด๋์ ๋ ๋๋ง์ ๋ก์ปฌ GPU pool์ ์ฐ๋ ์์ด๋ค.
์ค์ ์์
HP Z Workstations์ Z Boost
HP๋ Z8 Fury G6i, ZBook, ZGX AI Stations, Z Boost ๊ฐ์ ์ ํ์ AI workload์ ์ฐ๊ฒฐํ๋ค. ์ฌ๊ธฐ์ ์ค์ํ ๊ฒ์ โ๊ฐ์ธ์ฉ PC๊ฐ ์ํผ์ปดํจํฐ๊ฐ ๋๋คโ๊ฐ ์๋๋ผ, ๊ธฐ์ ์ด ๋ก์ปฌ GPU๋ฅผ ๋ ์ฒด๊ณ์ ์ผ๋ก ๊ด๋ฆฌํ๊ณ ๊ณต์ ํ๋ฉฐ AI workload๋ฅผ ๋ฐฐ์นํ๋ ค ํ๋ค๋ ์ ์ด๋ค.
Z Boost๋ workstation GPU๋ฅผ on-demand shared resource์ฒ๋ผ ์ฐ๋ ค๋ ์ ๊ทผ์ด๋ค. ์ค์ ๊ฒฝ์ ์ฑ์ด ํ์ธ๋๋ ค๋ฉด ๊ณ ๊ฐ ํ๊ฒฝ์์ GPU utilization, ๋คํธ์ํฌ ๋ณ๋ชฉ, ์ฌ์ฉ์ ๋๊ธฐ ์๊ฐ, ์ด์์ ๋น์ฉ์ ๋ ๋ด์ผ ํ๋ค.
HP์ OpenAI Frontier ์ฌ๋ก
OpenAI Frontier์ HP ์ฌ๋ก๋ ๊ธฐ์ AI workflow๊ฐ partner portal, device telemetry, ๋ณด์ remediation, software delivery ๊ฐ์ ๋ด๋ถ ์์คํ ๊ณผ ์ฐ๊ฒฐ๋๋ ๋ชจ์ต์ ๋ณด์ฌ์ค๋ค. ์ด๋ฐ workflow๊ฐ ๋ง์์ง์๋ก โ๋ชจ๋ธ์ ์ด๋์ ๋ถ๋ฅผ ๊ฒ์ธ๊ฐโ๋ฟ ์๋๋ผ โ๋ฐ์ดํฐ์ ์คํ ๊ธฐ๋ก์ ์ด๋์ ๋ ๊ฒ์ธ๊ฐโ๋ ์ค์ํด์ง๋ค.
LLM inference serving๊ณผ์ ์ฐ๊ฒฐ
LLM inference serving์ ๋ณดํต ๋ฐ์ดํฐ์ผํฐ์ API ๊ด์ ์์ ์ฝํ์ง๋ง, hybrid AI compute์์๋ ์ผ๋ถ ์ถ๋ก ์ด ๋ก์ปฌยท์ฌ๋ดยท์ฃ์ง ํ๊ฒฝ์ผ๋ก ๋ด๋ ค์ฌ ์ ์๋ค. ๋ฏผ๊ฐ ๋ฐ์ดํฐ, ๋น์ฉ ํต์ , ์ง์ฐ ์๊ฐ, ์คํ๋ผ์ธ ํ๊ฒฝ์ด ์ด์ ๊ฐ ๋ ์ ์๋ค.
ํท๊ฐ๋ฆฌ์ง ๋ง์์ผ ํ ์
- Hybrid AI compute๋ โํด๋ผ์ฐ๋ ๋์ ๋ก์ปฌ PC์์ ๋ชจ๋ AI๋ฅผ ๋๋ฆฌ์โ๋ ๋ง์ด ์๋๋ค. ์ ๋ฌด๋ณ๋ก ์คํ ์ฅ์๋ฅผ ๋๋๋ ์ ๋ต์ด๋ค.
- ์ํฌ์คํ ์ด์ GPU๊ฐ ๊ฐํด์ ธ๋ ๋๊ท๋ชจ foundation model ํ์ต์ ๋ชจ๋ ๋ก์ปฌ์์ ํ๋ค๋ ๋ป์ ์๋๋ค.
- ๋ก์ปฌ ์คํ์ ๋ณด์ ๋ฌธ์ ๋ฅผ ์๋์ผ๋ก ํด๊ฒฐํ์ง ์๋๋ค. ์ฅ๋น ๋ถ์ค, ํ์จ์ด, ๋ก๊ทธ, ์ ๋ฐ์ดํธ, ์ ๊ทผ๊ถ ๊ด๋ฆฌ๊ฐ ๋ ์ค์ํด์ง ์ ์๋ค.
- Vendor ๋ฐํ์ ์ฑ๋ฅ ์์น๋ ์ค์ workload, ๋๋ผ์ด๋ฒ, ๋คํธ์ํฌ, ์ฅ๋น ๊ตฌ์ฑ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์๋ค.
๊ด๋ จ ๋ฌธ์
- HP Z Workstations์ Z Boost๋ AI compute๊ฐ ํด๋ผ์ฐ๋ ๋ฐ์ผ๋ก๋ ๋ถ์ฐ๋๋ค๋ ์ ํธ๋ค
- OpenAI Frontier์ HP ์ฌ๋ก๋ ๊ธฐ์ AI์ ์ด์ ๋ชจ๋ธ ๋ฌธ์ ๋ฅผ ๋ณด์ฌ์ค๋ค
- AI capex cycle
- LLM inference serving
- Enterprise AI operating model
- NVIDIA