- 기타·
stackoverflow-blog·#ai-agents#slack#agentic-stack - 기타·
airbnb-eng·Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure
#data-platform#knowledge-graph#identity-graph - 기타·
aws-architecture·How ALS GeoAnalytics LITHOLENS ™ revolutionizes core logging through machine learning with Amazon EKS
#eks#machine-learning#geoanalytics - 기타·
aws-architecture·How Synthesia optimizes generative AI video inference on Amazon EC2 G7e instances
#inference#generative-ai#ec2+1 - 기타·
cloudflare-blog·Announcing Claude Managed Agents on Cloudflare
#claude#managed-agents#cloudflare - 아키텍처·
AWS Korea·씨미가 4K · 4초 저지연 라이브를 만든 방법 — Amazon IVS와 자체 구축의 하이브리드 설계
문제4K 초고화질 라이브 스트리밍에서 고비트레이트(35Mbps)와 저지연(4초 이내)을 동시에 제공하며 1만 명 동시 시청자를 안정적으로 처리.
접근Amazon IVS 는 1080p 표준 영역에 위임, 4K 차별화 영역은 자체 GPU 트랜스코딩 서버 + HLS + CloudFront URL Sharding + PDT 기반 라이브/VOD 통합으로 구성한 하이브리드 설계.
결과4K 35Mbps 환경에서 1만 명 동시 시청자 부하 테스트 안정 통과, 목표 저지연 달성, NAT Gateway / CloudFront L2 fan-out 극단 시나리오까지 사전 대비.
#live-streaming#amazon-ivs#low-latency+3 - 기타·
stackoverflow-blog·Your fridge could be a threat to national security
#supply-chain#iot-security#national-security - 아키텍처·
AWS Korea·CJ올리브영의 AI 협업 개발 프로세스 구축, AI-DLC 실전 도입 사례
문제AI 코딩 도구의 개인 생산성 향상에도 팀 전체의 일관된 협업 구조와 반복 가능한 프로세스가 부재.
접근AWS AI-DLC 방법론과 Kiro IDE 로 "요구사항 정의 → 설계 → 구현 → 검증" 단계별 워크플로우 구성. Amazon Bedrock, OpenSearch, Step Functions, Custom Agents 활용.
결과5개 과제 3일 완성, 개발 속도 5배 이상 단축, 수동 업무 처리시간 30배 감소(5분→10초), 조직 전체 AI 활용 역량 평준화.
#ai-collaboration#ai-dlc#dev-process+5 - 기타·
twilio-eng·Gmail’s top 10 sender issues: what senders need to know
#email-deliverability#gmail#smtp - 기타·
spotify-eng·Better Experiments with LLM Evals — A funnel, not a fork
#experimentation#llm-evals#ml-platform - AI / ML·
AWS Korea·GloZ의 Amazon OpenSearch Service를 기반으로 한 자연어 이력서 검색 시스템 구축 사례 — Part 1: 데이터 파이프라인과 인덱싱
문제콘텐츠 번역가 10만 명을 자연어로 검색하려면 BM25 키워드와 벡터 의미 검색을 동시에 잘 다뤄야 한다. 기존 PostgreSQL 검색은 nDCG@10 0.90 목표에 미달.
접근Amazon OpenSearch Service 로 이전하면서 Nori 한국어 형태소 분석기 + 다국어 임베딩 + Bedrock Cohere/Claude 로 데이터 정제 파이프라인 구축. 단일 쿼리에서 키워드와 벡터를 결합.
결과nDCG@10 0.90 이상 달성. 표준 어휘 사전과 별칭 매핑으로 이력서 데이터 일관성도 확보.
#embedding#opensearch#rag+2 - 기타·
stackoverflow-blog·“You can't vibe code scale”: What the AI hype gets wrong about software engineering
#ai-coding#software-engineering#scale - 인프라 / DevOps·
베스핀글로벌·엔비디아 쓰던 빅테크들, 왜 직접 ‘AI 칩’ 설계에 뛰어드나?
문제2026 년 AI 연산의 66% 가 추론에서 발생할 전망. 범용 GPU 는 학습엔 강하지만 추론 환경에서 전력·단가 비효율.
접근빅테크들이 ASIC(주문형 반도체) 자체 설계로 전환. 구글 TPU(2015), 아마존 트레이니엄+인퍼런시아 분리, MS 하드웨어·소프트웨어 동시 설계, 메타·OpenAI 는 파트너십.
결과추론 전용 칩 시장 2026 년 500억 달러 전망. 단순 비용 절감을 넘어 자사 서비스 최적화 인프라로 엔비디아 의존도 분산.
#gpu#asic#ai-chip+2 - 기타·
cloudflare-blog·Project Glasswing: what Mythos showed us
#cloudflare#ddos#network-security - 인프라 / DevOps·
베스핀글로벌·AI Paradox (1) | LLM 인프라 비용, 1시간 만에 8,500만 원 날라간 이유
문제AI PoC 월 300만 원이 본 운영 전환 시 3,800만 원까지 폭증. GPU 유휴율 68%, 토큰 폭주로 71분 만에 8,500만 원 손실 사례.
접근FinOps 3단계: Inform(GPU 활성화율·토큰 소비 가시화) → Optimize(작업 난이도별 LLM 선택으로 최대 80% 절감) → Operate(자동화 스케줄링·토큰 거버넌스).
결과LLM 인프라 비용 61% 절감, GPU 유휴율 68% → 12%. 콜드 스타트 우려에 갇혀 유휴 GPU 못 끄던 운영 책임 분담 문제를 자동화로 해결.
#gpu#cost-optimization#finops+2 - 보안·
베스핀글로벌·AI Paradox (2) | 보안 공격도 AI가 하는 시대, 기업 자산을 지키는 4가지 전략
문제해커가 직접 공격하던 시대에서 AI 가 자동으로 취약점을 찾는 시대로 진화. 이미지 패턴·학습 데이터 오염·프롬프트 인젝션 등 신규 공격 표면.
접근4단계 방어: 사내 AI·데이터 접근 현황 파악 → 배포 전 모의 해킹 → 실시간 입출력 필터링 → 24시간 모니터링. 더불어 승인 안 된 AI 도구 사용 통제, AI 에이전트에 사람과 동등한 신원·권한 관리.
결과적대적 입력·데이터 포이즈닝·프롬프트 인젝션·과도한 권한 부여로 인한 내부 시스템 초기화 같은 사고를 사전 차단.
#ai-security#threat-modeling#prompt-injection+2 - AI / ML·
베스핀글로벌·AI Paradox (3) | 할루시네이션의 진짜 원인은 데이터 파이프라인에 있다
문제AI 할루시네이션은 모델이 아니라 데이터 파이프라인 결함의 결과. PoC 에서 90% 정확도였던 모델이 프로덕션에서 실패하는 이유.
접근3 레이어 구조: 입력단 AI 기반 자동 품질 감시 → 거버넌스 레이어로 출처·흐름·접근 추적 → 출력단 AI-on-AI 자동 검증. 검색 품질이 답변 정확도를 좌우하므로 맥락 기반 청킹·멀티모달 임베딩·하이브리드 검색·리랭킹 네 기법 적용.
결과단일 플랫폼 도입이나 벡터 DB 구축만으론 부족함을 명확히 한 실전 검증 패턴. 도메인별 맥락을 잃지 않는 데이터 파이프라인이 진짜 해법.
#data-pipeline#rag#governance+2 - 인프라 / DevOps·
AWS Korea·뉴빌리티의 Amazon Kinesis Video Streams 기반 원격 관제 확장 사례
문제자율주행 로봇 300대를 RTSP + 포트포워딩으로 원격 관제하니 신규 사이트마다 20분~수시간 네트워크 설정이 필요. 운영 확장 불가.
접근Amazon Kinesis Video Streams 의 WebRTC Signaling Channel 로 P2P 연결 구성. roundTripTime, fractionLost 메트릭 + TWCC 기반 비트레이트 조정으로 LTE 가변 환경 대응.
결과포트포워딩 제거, 외부 이해관계자도 영상 접근 가능, 네트워크 변동에도 안정 품질 유지.
#aws#iot#webrtc+2 - 기타·
twilio-eng·Build a Voice and SMS AI Agent with Twilio Agent Connect and Microsoft Azure
#voice-ai#twilio#azure - 기타·
gitlab-eng·Codex and GitLab: From code fix to production
#ci-cd#codex#gitlab - 기타·
gitlab-eng·Beyond BYOK: Why governance matters for AI agents
#byok#ai-governance#compliance