pile·
인프라 / DevOps·네이버 플레이스네이버 플레이스·

MinIO 도입기— HA 이해 및 DR 전략 구성

문제네이버 G플레이스 AI팀이 머신러닝 학습 데이터·모델 아티팩트를 보관하던 Ceph 스토리지에서 장애가 반복돼 안정적인 대안이 필요했다.
접근MinIO를 4대 서버로 구성하고 드라이브·노드·IDC 레벨 장애를 시나리오 별로 검증했다. Erasure Coding 동작과 Scale Up/Out 영향을 실측하고, DR은 Airflow가 HDFS로 정기 백업하는 Backup & Recovery 방식으로 잡았다.
결과(N/2+1) 디스크 정상 시 쓰기 가능을 확인하고, 1TB 복구에 약 3시간이 걸리는 RTO/RPO 기준을 운영 매뉴얼로 정리했다.
네이버 플레이스
네이버 플레이스 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1