Hybrid AI compute๋Š” AI workload๋ฅผ ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ํ•œ ํด๋ผ์šฐ๋“œ์—๋งŒ ๋ชฐ์•„๋„ฃ์ง€ ์•Š๊ณ , ํด๋ผ์šฐ๋“œยท์‚ฌ๋‚ด ๋ฐ์ดํ„ฐ์„ผํ„ฐยท์›Œํฌ์Šคํ…Œ์ด์…˜ยท์—ฃ์ง€ ์žฅ๋น„๋ฅผ ์—…๋ฌด ์„ฑ๊ฒฉ์— ๋งž๊ฒŒ ๋‚˜๋ˆ  ์“ฐ๋Š” ๊ณ„์‚ฐ ๊ตฌ์กฐ๋‹ค. HP์˜ Z Workstations์™€ Z Boost ๋ฐœํ‘œ์ฒ˜๋Ÿผ, AI ์ธํ”„๋ผ ๋…ผ์˜๊ฐ€ ๋ฐ์ดํ„ฐ์„ผํ„ฐ GPU์—์„œ ์ง์›์ด ์“ฐ๋Š” ๊ณ ์„ฑ๋Šฅ ์žฅ๋น„์™€ ์‚ฌ๋‚ด ์šด์˜ ์ฒด๊ณ„๊นŒ์ง€ ๋‚ด๋ ค์˜ฌ ๋•Œ ์ด ๊ฐœ๋…์ด ์ค‘์š”ํ•ด์ง„๋‹ค.

ํ•œ ์ค„๋กœ ๋งํ•˜๋ฉด

Hybrid AI compute๋Š” AI ๊ณ„์‚ฐ์„ โ€œ์–ด๋””์„œ ๋Œ๋ฆด ๊ฒƒ์ธ๊ฐ€โ€๋ฅผ ๋น„์šฉ, ์ง€์—ฐ ์‹œ๊ฐ„, ๋ฐ์ดํ„ฐ ๋ณด์•ˆ, ์žฅ๋น„ ํ™œ์šฉ๋ฅ ์— ๋งž์ถฐ ํด๋ผ์šฐ๋“œ์™€ ๋กœ์ปฌ ์žฅ๋น„ ์‚ฌ์ด์— ๋ฐฐ์น˜ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

๋น„์œ ๋กœ ์ดํ•ดํ•˜๊ธฐ

๋ชจ๋“  ์ง์„ ์ค‘์•™ ๋ฌผ๋ฅ˜์ฐฝ๊ณ ๋กœ๋งŒ ๋ณด๋‚ด๋ฉด ํฐ ๋ฌผ๋Ÿ‰์„ ์ฒ˜๋ฆฌํ•˜๊ธฐ๋Š” ์ข‹๋‹ค. ํ•˜์ง€๋งŒ ๋™๋„ค์—์„œ ๋ฐ”๋กœ ์ฒ˜๋ฆฌํ•ด์•ผ ํ•˜๋Š” ๋น ๋ฅธ ๋ฐฐ์†ก, ๋ฏผ๊ฐํ•œ ๋ฌผ๊ฑด, ์ž์ฃผ ์˜ค๊ฐ€๋Š” ์†Œ๋Ÿ‰ ์ž‘์—…๊นŒ์ง€ ์ „๋ถ€ ์ค‘์•™ ์ฐฝ๊ณ ๋กœ ๋ณด๋‚ด๋ฉด ์˜คํžˆ๋ ค ๋น„์‹ธ๊ณ  ๋А๋ ค์งˆ ์ˆ˜ ์žˆ๋‹ค.

AI compute๋„ ๋น„์Šทํ•˜๋‹ค. ๋Œ€ํ˜• ๋ชจ๋ธ ํ•™์Šต์ด๋‚˜ ๊ฑฐ๋Œ€ํ•œ batch inference๋Š” ํด๋ผ์šฐ๋“œยท๋ฐ์ดํ„ฐ์„ผํ„ฐ๊ฐ€ ์ž์—ฐ์Šค๋Ÿฝ๋‹ค. ๋ฐ˜๋Œ€๋กœ ์ œํ’ˆ ์„ค๊ณ„ ํŒŒ์ผ, ์˜์ƒ ๋ Œ๋”๋ง, ์‚ฌ๋‚ด ๊ธฐ๋ฐ€ ๋ฐ์ดํ„ฐ, ์ง€์—ฐ ์‹œ๊ฐ„์ด ์ค‘์š”ํ•œ ์ถ”๋ก , ๊ฐœ๋ฐœ์ž์˜ ์‹คํ—˜ workload๋Š” ์›Œํฌ์Šคํ…Œ์ด์…˜์ด๋‚˜ ์‚ฌ๋‚ด ์žฅ๋น„์—์„œ ์ฒ˜๋ฆฌํ•˜๋Š” ํŽธ์ด ๋” ๋‚ซ๊ฑฐ๋‚˜ ๋” ์•ˆ์ „ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋น„์œ ์˜ ํ•œ๊ณ„๋Š” ์žˆ๋‹ค. AI workload๋Š” ๋‹จ์ˆœํ•œ ํƒ๋ฐฐ๊ฐ€ ์•„๋‹ˆ๋ผ ๋ชจ๋ธ, ๋ฐ์ดํ„ฐ, GPU ๋ฉ”๋ชจ๋ฆฌ, ๋„คํŠธ์›Œํฌ, ๋“œ๋ผ์ด๋ฒ„, ๋ณด์•ˆ ์ •์ฑ…, ๋กœ๊ทธ ๊ด€๋ฆฌ๊ฐ€ ํ•จ๊ป˜ ์›€์ง์ธ๋‹ค. ๊ทธ๋ž˜์„œ โ€œ๊ฐ€๊นŒ์šด ๊ณณ์—์„œ ๋Œ๋ฆฌ๋ฉด ๋œ๋‹คโ€๊ฐ€ ์•„๋‹ˆ๋ผ, ์–ด๋А ๊ณ„์‚ฐ์„ ์–ด๋А ํ™˜๊ฒฝ์— ๋‘˜์ง€ ์šด์˜ ๋ชจ๋ธ๊นŒ์ง€ ๊ฐ™์ด ์„ค๊ณ„ํ•ด์•ผ ํ•œ๋‹ค.

์ •ํ™•ํ•œ ์ •์˜

Hybrid AI compute๋Š” AI ์—…๋ฌด๋ฅผ ๋‹จ์ผ ์‹คํ–‰ ์žฅ์†Œ์— ๊ณ ์ •ํ•˜์ง€ ์•Š๊ณ , workload์˜ ํŠน์„ฑ์— ๋”ฐ๋ผ ์—ฌ๋Ÿฌ compute layer์— ๋ฐฐ์น˜ํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜๋‹ค.

์‹คํ–‰ ์œ„์น˜์ž˜ ๋งž๋Š” ์—…๋ฌด์ฃผ์š” ์งˆ๋ฌธ
๋Œ€ํ˜• ํด๋ผ์šฐ๋“œยท๋ฐ์ดํ„ฐ์„ผํ„ฐ๋Œ€๊ทœ๋ชจ ํ•™์Šต, ๋Œ€๋Ÿ‰ ์ถ”๋ก , ํƒ„๋ ฅ์  GPU ์ˆ˜์š”๋น„์šฉ, ์ „๋ ฅ, GPU ๊ณต๊ธ‰, ๋ฐ์ดํ„ฐ ์ด๋™ ๋น„์šฉ
์‚ฌ๋‚ด ๋ฐ์ดํ„ฐ์„ผํ„ฐ๊ทœ์ œ ์‚ฐ์—…, ๋ฏผ๊ฐ ๋ฐ์ดํ„ฐ, ๋‚ด๋ถ€ ์‹œ์Šคํ…œ ํ†ตํ•ฉ๋ณด์•ˆ, ์šด์˜ ์ธ๋ ฅ, ์žฅ๋น„ ํˆฌ์ž, ๊ฐ์‚ฌ ๊ธฐ๋ก
์›Œํฌ์Šคํ…Œ์ด์…˜ยทAI station์„ค๊ณ„, ๋ Œ๋”๋ง, ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ๊ฐœ๋ฐœ์ž ์‹คํ—˜, ๋กœ์ปฌ fine-tuningGPU ํ™œ์šฉ๋ฅ , ์žฅ๋น„ ๊ณต์œ , ์†Œํ”„ํŠธ์›จ์–ด ๊ด€๋ฆฌ
์—ฃ์ง€ยทendpoint์ง€์—ฐ ์‹œ๊ฐ„์ด ์ค‘์š”ํ•œ ์ถ”๋ก , ํ˜„์žฅ ์žฅ๋น„, ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์—…๋ฐ์ดํŠธ, ๋ณด์•ˆ, ๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™”, ์žฅ์•  ๋Œ€์‘

์ด ๊ฐœ๋…์€ AI capex cycle์„ ๋” ๋„“๊ฒŒ ๋ณด๊ฒŒ ํ•œ๋‹ค. AI ํˆฌ์ž๋Š” ๋ฐ์ดํ„ฐ์„ผํ„ฐ GPU๋งŒ์ด ์•„๋‹ˆ๋ผ workstation, edge accelerator, device management, endpoint ๋ณด์•ˆ, ๋กœ์ปฌ inference ์šด์˜๊นŒ์ง€ ํผ์งˆ ์ˆ˜ ์žˆ๋‹ค.

์™œ ์ค‘์š”ํ•œ๊ฐ€

1. AI ์ธํ”„๋ผ ๋น„์šฉ์˜ ๋‹จ์œ„๊ฐ€ ๋„“์–ด์ง„๋‹ค

AI capex๋ฅผ ๋ฐ์ดํ„ฐ์„ผํ„ฐ์™€ ํด๋ผ์šฐ๋“œ GPU๋งŒ์œผ๋กœ ๋ณด๋ฉด ์ผ๋ถ€๋งŒ ๋ณด๊ฒŒ ๋œ๋‹ค. ๊ธฐ์—…์ด AI workflow๋ฅผ ์‹ค์ œ ์—…๋ฌด์— ๋„ฃ๊ธฐ ์‹œ์ž‘ํ•˜๋ฉด, ๊ฐœ๋ฐœ์ž ์žฅ๋น„, ๋ณด์•ˆ์ด ํ•„์š”ํ•œ ์‚ฌ๋‚ด ์žฅ๋น„, ํ˜„์žฅ inference ์žฅ์น˜, ์žฅ๋น„ ๊ณต์œ  ์†Œํ”„ํŠธ์›จ์–ด๋„ ํˆฌ์ž ๋Œ€์ƒ์ด ๋œ๋‹ค.

HP Z Workstations์™€ Z Boost ๋ฐœํ‘œ๋Š” ์ด ์‹ ํ˜ธ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค. HP๋Š” ๊ณ ์„ฑ๋Šฅ workstation์„ AI development, rendering, simulation, inference, fine-tuning ์—…๋ฌด์™€ ์—ฐ๊ฒฐํ•˜๊ณ , Z Boost๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ GPU๋ฅผ shared resource์ฒ˜๋Ÿผ ์“ฐ๋Š” ๊ทธ๋ฆผ์„ ์ œ์‹œํ–ˆ๋‹ค.

2. ๋ฐ์ดํ„ฐ ์œ„์น˜์™€ ์ง€์—ฐ ์‹œ๊ฐ„์ด ๊ธฐ์ˆ  ์„ ํƒ์„ ๋ฐ”๊พผ๋‹ค

๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ํด๋ผ์šฐ๋“œ๋กœ ์˜ฌ๋ฆฌ๋Š” ๊ฒƒ์ด ํ•ญ์ƒ ์ตœ์„ ์€ ์•„๋‹ˆ๋‹ค. ์˜๋ฃŒยท๊ธˆ์œตยท์ œ์กฐ ์„ค๊ณ„ยท๋ณด์•ˆ ์—…๋ฌด์ฒ˜๋Ÿผ ๋ฏผ๊ฐํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋Š” ๊ฒฝ์šฐ, ๋กœ์ปฌ ์‹คํ–‰์ด๋‚˜ ์‚ฌ๋‚ด ์‹คํ–‰์ด ๋” ์ž์—ฐ์Šค๋Ÿฌ์šธ ์ˆ˜ ์žˆ๋‹ค. ์‹ค์‹œ๊ฐ„ ๋ฐ˜์‘์ด ์ค‘์š”ํ•œ ์—…๋ฌด๋„ ๋„คํŠธ์›Œํฌ ์ง€์—ฐ ์‹œ๊ฐ„๊ณผ ์žฅ์•  ๊ฐ€๋Šฅ์„ฑ์„ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.

๊ทธ๋ž˜์„œ hybrid AI compute๋Š” ๋‹จ์ˆœํ•œ ์žฅ๋น„ ์„ ํƒ์ด ์•„๋‹ˆ๋ผ enterprise AI operating model์˜ ์ผ๋ถ€๋‹ค. ๊ธฐ์—…์€ ์–ด๋–ค workflow๋ฅผ ์–ด๋””์„œ ์‹คํ–‰ํ•˜๊ณ , ์–ด๋–ค ๋กœ๊ทธ๋ฅผ ๋‚จ๊ธฐ๋ฉฐ, ์–ด๋–ค ๋ณด์•ˆ ์ •์ฑ…์„ ์ ์šฉํ• ์ง€ ํ•จ๊ป˜ ์ •ํ•ด์•ผ ํ•œ๋‹ค.

3. ํด๋ผ์šฐ๋“œ์™€ ๋กœ์ปฌ์€ ๋Œ€์ฒด ๊ด€๊ณ„๋งŒ์€ ์•„๋‹ˆ๋‹ค

๋กœ์ปฌ ์žฅ๋น„๊ฐ€ ๊ฐ•ํ•ด์ง„๋‹ค๊ณ  ํ•ด์„œ ํด๋ผ์šฐ๋“œ๊ฐ€ ์‚ฌ๋ผ์ง€๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. ๋” ํ˜„์‹ค์ ์ธ ๊ทธ๋ฆผ์€ cloud burst, ์‚ฌ๋‚ด ๋ณด์•ˆ workload, workstation ์‹คํ—˜, endpoint inference๊ฐ€ ํ•จ๊ป˜ ์“ฐ์ด๋Š” ๊ตฌ์กฐ๋‹ค. ํฐ ํ•™์Šต์€ ํด๋ผ์šฐ๋“œ์—์„œ ํ•˜๊ณ , ๋ฏผ๊ฐํ•œ ๋ถ„์„์€ ์‚ฌ๋‚ด์—์„œ ํ•˜๊ณ , ๋””์ž์ด๋„ˆ์˜ ๋ Œ๋”๋ง์€ ๋กœ์ปฌ GPU pool์„ ์“ฐ๋Š” ์‹์ด๋‹ค.

์‹ค์ œ ์˜ˆ์‹œ

HP Z Workstations์™€ Z Boost

HP๋Š” Z8 Fury G6i, ZBook, ZGX AI Stations, Z Boost ๊ฐ™์€ ์ œํ’ˆ์„ AI workload์™€ ์—ฐ๊ฒฐํ–ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์ค‘์š”ํ•œ ๊ฒƒ์€ โ€œ๊ฐœ์ธ์šฉ PC๊ฐ€ ์Šˆํผ์ปดํ“จํ„ฐ๊ฐ€ ๋๋‹คโ€๊ฐ€ ์•„๋‹ˆ๋ผ, ๊ธฐ์—…์ด ๋กœ์ปฌ GPU๋ฅผ ๋” ์ฒด๊ณ„์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๊ณ  ๊ณต์œ ํ•˜๋ฉฐ AI workload๋ฅผ ๋ฐฐ์น˜ํ•˜๋ ค ํ•œ๋‹ค๋Š” ์ ์ด๋‹ค.

Z Boost๋Š” workstation GPU๋ฅผ on-demand shared resource์ฒ˜๋Ÿผ ์“ฐ๋ ค๋Š” ์ ‘๊ทผ์ด๋‹ค. ์‹ค์ œ ๊ฒฝ์ œ์„ฑ์ด ํ™•์ธ๋˜๋ ค๋ฉด ๊ณ ๊ฐ ํ™˜๊ฒฝ์—์„œ GPU utilization, ๋„คํŠธ์›Œํฌ ๋ณ‘๋ชฉ, ์‚ฌ์šฉ์ž ๋Œ€๊ธฐ ์‹œ๊ฐ„, ์ด์†Œ์œ ๋น„์šฉ์„ ๋” ๋ด์•ผ ํ•œ๋‹ค.

HP์™€ OpenAI Frontier ์‚ฌ๋ก€

OpenAI Frontier์™€ HP ์‚ฌ๋ก€๋Š” ๊ธฐ์—… AI workflow๊ฐ€ partner portal, device telemetry, ๋ณด์•ˆ remediation, software delivery ๊ฐ™์€ ๋‚ด๋ถ€ ์‹œ์Šคํ…œ๊ณผ ์—ฐ๊ฒฐ๋˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค€๋‹ค. ์ด๋Ÿฐ workflow๊ฐ€ ๋งŽ์•„์งˆ์ˆ˜๋ก โ€œ๋ชจ๋ธ์„ ์–ด๋””์„œ ๋ถ€๋ฅผ ๊ฒƒ์ธ๊ฐ€โ€๋ฟ ์•„๋‹ˆ๋ผ โ€œ๋ฐ์ดํ„ฐ์™€ ์‹คํ–‰ ๊ธฐ๋ก์„ ์–ด๋””์— ๋‘˜ ๊ฒƒ์ธ๊ฐ€โ€๋„ ์ค‘์š”ํ•ด์ง„๋‹ค.

LLM inference serving๊ณผ์˜ ์—ฐ๊ฒฐ

LLM inference serving์€ ๋ณดํ†ต ๋ฐ์ดํ„ฐ์„ผํ„ฐ์™€ API ๊ด€์ ์—์„œ ์ฝํžˆ์ง€๋งŒ, hybrid AI compute์—์„œ๋Š” ์ผ๋ถ€ ์ถ”๋ก ์ด ๋กœ์ปฌยท์‚ฌ๋‚ดยท์—ฃ์ง€ ํ™˜๊ฒฝ์œผ๋กœ ๋‚ด๋ ค์˜ฌ ์ˆ˜ ์žˆ๋‹ค. ๋ฏผ๊ฐ ๋ฐ์ดํ„ฐ, ๋น„์šฉ ํ†ต์ œ, ์ง€์—ฐ ์‹œ๊ฐ„, ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์ด ์ด์œ ๊ฐ€ ๋  ์ˆ˜ ์žˆ๋‹ค.

ํ—ท๊ฐˆ๋ฆฌ์ง€ ๋ง์•„์•ผ ํ•  ์ 

  • Hybrid AI compute๋Š” โ€œํด๋ผ์šฐ๋“œ ๋Œ€์‹  ๋กœ์ปฌ PC์—์„œ ๋ชจ๋“  AI๋ฅผ ๋Œ๋ฆฌ์žโ€๋Š” ๋ง์ด ์•„๋‹ˆ๋‹ค. ์—…๋ฌด๋ณ„๋กœ ์‹คํ–‰ ์žฅ์†Œ๋ฅผ ๋‚˜๋ˆ„๋Š” ์ „๋žต์ด๋‹ค.
  • ์›Œํฌ์Šคํ…Œ์ด์…˜ GPU๊ฐ€ ๊ฐ•ํ•ด์ ธ๋„ ๋Œ€๊ทœ๋ชจ foundation model ํ•™์Šต์„ ๋ชจ๋‘ ๋กœ์ปฌ์—์„œ ํ•œ๋‹ค๋Š” ๋œป์€ ์•„๋‹ˆ๋‹ค.
  • ๋กœ์ปฌ ์‹คํ–‰์€ ๋ณด์•ˆ ๋ฌธ์ œ๋ฅผ ์ž๋™์œผ๋กœ ํ•ด๊ฒฐํ•˜์ง€ ์•Š๋Š”๋‹ค. ์žฅ๋น„ ๋ถ„์‹ค, ํŽŒ์›จ์–ด, ๋กœ๊ทธ, ์—…๋ฐ์ดํŠธ, ์ ‘๊ทผ๊ถŒ ๊ด€๋ฆฌ๊ฐ€ ๋” ์ค‘์š”ํ•ด์งˆ ์ˆ˜ ์žˆ๋‹ค.
  • Vendor ๋ฐœํ‘œ์˜ ์„ฑ๋Šฅ ์ˆ˜์น˜๋Š” ์‹ค์ œ workload, ๋“œ๋ผ์ด๋ฒ„, ๋„คํŠธ์›Œํฌ, ์žฅ๋น„ ๊ตฌ์„ฑ์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค.

๊ด€๋ จ ๋ฌธ์„œ

์ถœ์ฒ˜