KT 클라우드

kt-cloud

KT 클라우드의 엔지니어링 블로그. 매시간 RSS로 자동 수집해요.

원문 사이트 ↗📡RSS

15

전체

+1

이번 주

최신

인프라 / DevOps·KT 클라우드·1개월 전
[설계가이드] Terraform 모듈 설계, 원칙 없이 만들면 반드시 무너진다
Terraform 코드베이스가 커질수록 모듈 경계 설계 부재로 팀 간 충돌, 예기치 않은 환경 파괴, 유지보수 어려움이 발생한다.
#devops#terraform#iac+2
인프라 / DevOps·KT 클라우드·1개월 전
[AI인프라] GPU 5만장 시대, AI 인프라 비즈니스 성공 조건
AI 인프라 시장에서 GPU 보유량이 아닌 하드웨어-소프트웨어 공동 설계(Co-design) 역량이 핵심 경쟁력으로 부상하고 있다.
#kubernetes#gpu#mlops+2
인프라 / DevOps·KT 클라우드·1개월 전
케클s피드 5월호｜안정적인 클라우드를 만드는 핵심 아키텍처
클라우드 서비스 안정성을 확보하려면 장애 복구가 아닌 무중단 운영이 필요하지만 기존 DR 구조와 단일 리전 사용은 한계가 있다.
#high-availability#disaster-recovery#cloud+1
인프라 / DevOps·KT 클라우드·1개월 전
[기술 분석] kubernetes Ingress API의 중단. 그 뒤를 잇는 Gateway API 파헤치기
Kubernetes 가 Ingress NGINX 기술지원 중단을 발표했고 기존 Ingress 는 복잡한 라우팅 구현 시 "Annotation 지옥" 한계가 컸다.
#kubernetes#ingress#nginx+2
인프라 / DevOps·KT 클라우드·1개월 전
[AI인프라] AI 데이터센터(AIDC)는 무엇이 다른가: GPU 전력과 운영 전환
생성형 AI 학습 워크로드가 늘면서 기존 데이터센터로는 GPU 클러스터의 전력/발열/운영 요구를 감당할 수 없다.
#gpu#liquid-cooling#data-center+2
아키텍처·KT 클라우드·1개월 전
[백업·DR] kt cloud 재해복구 설계: Multi-AZ와 Multi-Region
클라우드 DR 을 설계할 때 Multi-AZ 와 Multi-Region 을 단순 확장 관계로 보면 RPO/RTO, 비용, 운영 함정에 부딪힌다.
#disaster-recovery#multi-az#multi-region+2
AI / ML·KT 클라우드·1개월 전
[인사이트] 코드에서 근육으로: 피지컬 AI와 데이터센터 인프라
고집적 AIDC 는 인간 운영자에게 발열/소음/위험 측면에서 한계가 있어 피지컬 AI 와 휴머노이드 로봇의 단계적 투입 방향을 정해야 한다.
#data-center#physical-ai#humanoid-robot+2
AI / ML·KT 클라우드·1개월 전
[AI활용] AI Portal부터 보안관제까지, kt cloud AI 내재화 3가지 사례
kt cloud 는 사내 데이터/관제 업무에서 Jira/Salesforce/사내문서 산재, Splunk SPL 전문인력 의존, 관제요원 숙련도 편차 같은 비효율을 겪었다.
#rag#mcp#llm+2
인프라 / DevOps·KT 클라우드·1개월 전
[도입가이드] 인프라 관리의 표준, IaC의 본질과 도입 가치
콘솔 임의 변경으로 설정 드리프트, 개발/운영 환경 불일치, 담당자 퇴사 시 인프라 파악 불가, 재해 복구 시나리오 재현 불가 같은 수동 인프라 관리의 함정이 반복된다.
#terraform#iac#ansible+1
AI / ML·KT 클라우드·1개월 전
[리뷰] 책상 위의 데이터센터, Dell Pro Max GB10 AI 워크스테이션 실사용기
70B 급 대형 LLM 을 로컬에서 돌리려면 GPU 가 비싸고 전력/소음이 부담이라 보안 민감 환경에서 데이터센터급 성능을 책상 위에 두기 어렵다.
#llm#inference#workstation+2
인프라 / DevOps·KT 클라우드·1개월 전
[운영가이드] kt cloud AIDC UPS 전원설비 단락사고 특성과 보호장치
AIDC 데이터센터에서 UPS 단락사고 시 초기 전류가 정격의 최대 2.83배까지 치솟아 열적/기계적 소손을 일으키며 기존 50ms 차단으로는 보호가 부족했다.
#data-center#ups#sscb
인프라 / DevOps·KT 클라우드·1개월 전
[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선
쿠버네티스는 AI/ML 워크로드 수용과 운영 유연성, 누적된 기술 부채 정리를 동시에 풀어야 했다.
#kubernetes#scheduling#ai-workload+2
AI / ML·KT 클라우드·2개월 전
[AI활용] kt cloud AI Foundry로 AI 서비스 구축 흐름 한 번에 살펴보기
기업이 자체 AI 서비스를 구축하려면 모델 선정/RAG/안전 가드/배포/운영을 분리해서 다뤄야 하는데 각 단계가 흩어져 있어 체계화가 어렵다.
#rag#llm#vector-db+2
인프라 / DevOps·KT 클라우드·2개월 전
AI 는 버블인가 — Capex/Cash Flow 로 분석한 AI 인프라 투자 사이클과 데이터센터 사업자 전략
상위 5 하이퍼스케일러의 영업현금흐름 대비 Capex 가 50% 까지 치솟고 net burn 이 2억 달러를 넘으며 AI 인프라 사이클이 수익화 속도를 추월하는지 검증해야 했다.
#data-center#ai-infra#capex
AI / ML·KT 클라우드·2개월 전
케클s피드 4월호｜AI, 더 빠르고 더 효율적인 방식으로
기업·공공기관은 AI 도입 단계를 지나 ‘어떻게 안정적으로 운영할지’와 PoC 정체·보안 인증 문제를 풀어야 했다.
#kubernetes#rag#ai-platform+2