글루시스

gluesys

글루시스의 엔지니어링 블로그. 매시간 RSS로 자동 수집해요.

원문 사이트 ↗📡RSS

10

전체

+1

이번 주

최신

인프라 / DevOps·글루시스·7개월 전
Lustre Changelog DR
Lustre 같은 대규모 분산 파일시스템에서 rsync 기반 DR은 매번 전체 스캔이 필요해 수십 시간이 걸렸고, RPO를 짧게 가져가기 어려웠다.
#disaster-recovery#changelog#redis-stream+2
인프라 / DevOps·글루시스·10개월 전
Lustre의 파일 create & open 과정 분석 - 2
Lustre 분산 파일시스템에서 클라이언트가 파일을 create·open할 때 MDS(메타데이터 서버)와 클라이언트 사이에서 어떤 절차로 메타데이터·OST 매핑이 만들어지는지 내부 흐름이 명확하지 않으면 운영 디버깅이 어렵다.
#lustre#distributed-filesystem#mds+2
인프라 / DevOps·글루시스·2025년
Lustre의 파일 create & open 과정 분석 - 1
Lustre 파일시스템에서 새 파일을 만드는 단순한 동작 뒤에 LLITE·LMV·MDC·LOV·OSC를 가로지르는 복잡한 처리 흐름이 숨어 있어, 디버깅과 튜닝의 진입 장벽이 컸다.
#linux#filesystem#lustre+2
기타·글루시스·2024년
디자인 도구 Penpot(펜팟) 설치부터 활용까지
팀에서 Figma 대체 디자인 도구가 필요했고, 셀프 호스팅으로 비용을 절감할 오픈소스를 탐색했다.
#open-source#design-system#figma+2
인프라 / DevOps·글루시스·2024년
병렬 네트워크 파일 시스템 pNFS의 재조명
단일 NFS 서버는 메타데이터와 데이터 경로가 묶여 대규모 병렬 접근 시 병목이 발생한다.
#linux#storage#nfs+2
인프라 / DevOps·글루시스·2024년
LVM 스냅샷 관리 기능 개발 후기 (1)
AnyStor 제품에서 Thin/Thick 볼륨 스냅샷 구현 시 풀 공간 고갈, 메타데이터 부족, 장애 복구 등 4가지 이슈가 발생했다.
#linux#storage#lvm+2
인프라 / DevOps·글루시스·2024년
CXL 3.1 소개와 스토리지
PCIe 기반 인터커넥트는 대규모 데이터 전송 시 프로토콜 오버헤드가 발생하고, 메모리 채널에 비해 느려 AI/ML 워크로드의 메모리 공유에 병목이 생긴다.
#storage#memory#cxl+2
인프라 / DevOps·글루시스·2023년
ZFS 파일 시스템
기존 파일 시스템은 볼륨 매니저를 별도 운용해야 하고, 데이터 무결성·스냅샷·RAID 기능이 분산되어 복잡도가 높다.
#raid#linux#storage+2
인프라 / DevOps·글루시스·2023년
올플래시 스토리지 선정 시 체크포인트
올플래시 스토리지 도입 시 워크로드 유형(IOPS·스루풋·지연시간)에 따른 선정 기준이 불명확하고, 벤더가 제시하는 수치와 실제 성능 차이가 크다.
#storage#iops#ssd+2
인프라 / DevOps·글루시스·2023년
NVMe 시대의 RAID 2편: xiRAID
NVMe 시대의 소프트웨어 RAID 솔루션 xiRAID의 실제 성능이 공식 발표 자료와 어느 정도 일치하는지, 그리고 하드웨어 RAID 방식 SupremeRAID와 어떻게 다른지 검증이 필요하다.
#raid#storage#benchmark+2