아침 브리핑
이벤트와 신호
- Inference infrastructure: Etched의 rack-scale inference system 인터뷰는 LLM 실행 병목이 단순 연산량에서 memory topology, interconnect, 전력 효율로 이동하는지를 보여주는 신호입니다. LLM inference serving 관점에서 다시 읽을 만합니다.
- AI agent tooling: Google
agents-cli, Strix,video-use, Vercelskills처럼 agent가 CLI, 보안, 영상 편집, 배포 workflow로 확장되는 움직임이 이어지고 있습니다. - Loop engineering: agent loop를 프롬프트 기법이 아니라 queue, retry, observability, durable state가 있는 소프트웨어 시스템으로 보는 관점이 중요해지고 있습니다.
- AI와 금리 narrative: AI capex cycle 관점에서 Cleveland Fed 발언, AI spending, small-cap 강세, 금·달러 움직임이 같이 잡혔습니다. AI가 생산성뿐 아니라 설비·전력·자본재 수요를 통해 물가와 금리 논의에 연결되는지 볼 필요가 있습니다.
- 무역·원자재·지정학: EU steel import quota, phosphate fertilizer, copper output, 중앙은행의 달러 보유 선호 변화는 공급망과 자본 배분의 배경 조건을 바꿀 수 있는 신호입니다.
핵심 뉴스
-
Etched가 inference 전용 시스템을 전면에 내세우고 있습니다.
중요한 점은 “새 AI 칩” 자체보다 inference 비용과 병목이 어디에서 생기는가입니다. GPU 연산 성능만이 아니라 메모리, 연결망, 전력, rack-scale 설계가 함께 움직이는지 봐야 합니다. -
AI agent 도구가 개발 환경 안으로 들어오고 있습니다.
agent는 더 이상 채팅창 안의 보조 도구만이 아닙니다. CLI, penetration testing, 영상 편집, 배포 자동화처럼 실제 workflow의 경계면에서 제품화되고 있습니다. -
Agent 운영은 점점 일반 소프트웨어 엔지니어링 문제처럼 보입니다.
좋은 프롬프트보다 중요한 것이 중단 가능한 loop, 재시도, 관측 가능성, 상태 관리일 수 있습니다. 이 관점은 Agent Memory Consolidation과도 이어집니다. -
AI capex가 시장의 주변부로 번지는지 봐야 합니다.
AI spending과 실적 기대가 대형 기술주를 넘어 small-cap, 유틸리티, 자본재, 메모리, 전력 인프라 narrative로 확장되는지 확인할 필요가 있습니다. -
원자재와 무역정책은 AI infrastructure의 배경 조건입니다.
철강, 구리, 비료, 달러 보유 선호 같은 뉴스는 서로 달라 보이지만, 장기적으로는 공급망 비용과 정책 리스크를 바꿀 수 있습니다.
오늘 읽을 문서
- Etched의 rack-scale inference system 인터뷰
- Attention Is All You Need
- Manufactured Confidence
- LeVo 2
- Self-Attention
- Transformer Architecture
- LLM inference serving
- AI capex cycle
- Agent Memory Consolidation
- Agent Memory의 인식론적 상태
- Managed agents