1. Ubuntu 24.04에 ClickHouse 설치 (APT 방식)
공식 리포지토리를 등록하여 설치하는 것이 가장 안전하고 관리가 쉽습니다.
1단계: 필수 패키지 설치 및 GPG 키 등록
sudo apt-get update
sudo apt-get install -y apt-transport-https ca-certificates dirmngr curl gnupg
# GPG 키 추가
curl -fsSL 'https://packages.clickhouse.com/rpm/lts/repodata/repomd.xml.key' | sudo gpg --dearmor -o /usr/share/keyrings/clickhouse-keyring.gpg
2단계: 리포지토리 추가 및 설치
# 리포지토리 소스 리스트 추가
echo "deb [signed-by=/usr/share/keyrings/clickhouse-keyring.gpg] https://packages.clickhouse.com/deb stable main" | sudo tee /etc/apt/sources.list.d/clickhouse.list
# 패키지 목록 갱신 및 설치
sudo apt-get update
sudo apt-get install -y clickhouse-server clickhouse-client
설치 과정 중 default user에 대한 비밀번호 설정 프롬프트가 뜹니다. 원하는 비밀번호를 입력하세요.
3단계: 서비스 시작 및 상태 확인
sudo service clickhouse-server start
sudo service clickhouse-server status
4단계: 접속 테스트
clickhouse-client --password
2. 스타트업을 위한 백업 및 데이터 관리 전략
데이터가 비대해질 것이 우려되는 상황에서 스타트업이 취할 수 있는 현실적이고 효율적인 전략은 다음과 같습니다.
A. 백업 도구: clickhouse-backup (추천)
단순한 스크립트보다는 Altinity에서 만든 오픈소스 도구인 clickhouse-backup을 사용하는 것이 업계 표준입니다.
- 이유: ClickHouse의 데이터 구조(Part 등)를 이해하고 있어, 파일 시스템을 단순히 복사하는 것보다 훨씬 안정적이고 효율적입니다.
- 기능: 로컬 백업 생성 후 S3(또는 MinIO, GCS 등)와 같은 오브젝트 스토리지로 바로 업로드가 가능합니다.
B. 백업 주기 및 정책 (예시)
데이터 유실을 방지하면서 스토리지 비용을 아끼는 전략입니다.
- Full Backup: 주 1회 (주말 등 트래픽이 적은 시간)
- Incremental Backup (증분 백업): 매일 1회 (변경된 데이터만 백업하므로 빠르고 용량이 적음)
- 보관 주기: 최근 7일 치는 즉시 복구 가능하도록 유지, 오래된 백업은 S3의 수명 주기(Lifecycle) 정책을 통해 저렴한 스토리지 클래스(Glacier 등)로 이동하거나 삭제.
C. “비대해지는 데이터” 대응: 스토리지 티어링 (Tiered Storage)
백업과는 별개로, 디스크 용량 부족을 해결하기 위해 ClickHouse의 강력한 기능인 Tiered Storage를 적극 활용해야 합니다.
전략:
- Hot Data (최근 7일): 속도가 빠른 NVMe SSD에 저장 (N100/N150 미니 PC의 로컬 디스크).
- Cold Data (오래된 데이터): 로컬 HDD나 S3(오브젝트 스토리지)로 자동 이동시킵니다.
장점: 서버의 물리적 디스크 용량을 늘리지 않고도 페타바이트 단위까지 데이터를 저장할 수 있습니다. 쿼리 속도는 약간 느려지지만, 과거 데이터 조회용으로는 충분합니다.
요약
- 설치: 공식 deb 리포지토리를 통해 apt로 설치하세요.
- 백업:
clickhouse-backup도구를 설치하여 매일 S3로 증분 백업을 보내세요. - 용량 관리: 디스크가 찰 것을 대비해 미리 S3 기반의 스토리지 티어링 설정을 고려하세요.
Was this helpful?
0 / 0