ACROFAN

고효율과 고가용성을 모두 잡는, 지속가능한 데이터센터를 위한 구성 최적화

기사입력 : 2021년 02월 01일 10시 34분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
향후 10년간 일어날 사회 전반의 변화에 있어, 절대 빠지지 않는 요소로는 ‘디지털화’를 꼽을 수 있을 것이다. 디지털화는 컴퓨터간의 연결에서 시작해 모바일 디바이스로의 확장을 통한 사람과 사람간의 연결을 넘어, 앞으로는 우리 주위의 모든 사물들이 디지털 기반으로 연결되고, 모든 데이터들이 수집, 분석되어, 우리의 삶과 모든 활동들을 최적화할 수 있도록 움직일 것으로 기대된다. 그리고 향후 10년의 변화가 본격화되는 현재 시점에서, 디지털화의 진행에 따라 데이터의 양과 네트워크 트래픽, 그리고 디지털 서비스의 수요 모두 폭발적으로 증가할 것으로 예상된다.

앞으로 디지털화가 고도화됨에 따라 세상은 더욱 효율적으로 움직일 수 있게 될 것이지만, 이를 위해 해결해야 될 과제도 있다. 디지털 시대에 데이터와 서비스의 수요는 급격히 증가하고 있지만, 데이터가 모이고 처리되어, 서비스로 제공되는 ‘데이터센터’는 이 수요에 맞추어 단순히 확장될 수 없기 때문이다. 특히, 향후의 주요 에너지 형태로 꼽히는 ‘전기’의 수요와 공급에 대한 측면에서, 대형 데이터센터에서 소규모의 엣지 데이터센터에 이르기까지 데이터센터의 절대적인 에너지 사용량과 상대적인 에너지 효율성은, 향후의 고도로 디지털화될 세상이 지속 가능할지를 결정할 중요한 부분이 될 것이다.

앞으로 더욱 고도화될 디지털 시대를 위해서, 데이터센터의 에너지 효율은 절대적인 측면, 상대적인 측면 모두 현재보다 높아져야 한다. 그리고 이러한 효율적인 데이터센터의 구성은 지금까지 서로 다른 영역으로 다루어지던 IT 영역과 시설의 영역 양 쪽이 긴밀하게 연결되어 최적화되어야 할 것이다. 그리고 이러한 고밀도, 고효율의 데이터센터 환경의 구현에 있어 OCP(Open Compute Project)는 IT 영역과 시설 영역 모두가 긴밀히 연결된 새로운 방향을 제시하고 있다. 대규모 고밀도 클라우드 인프라에 최적화된 OCP의 모델에서 핵심은 ‘중복 요소 제거’를 통한 효율 극대화인데, 이는 IT 인프라 뿐 아니라, IT 자원을 위한 전력 공급 인프라 등에서도 주목해야 할 부분이다.

▲ 디지털 기술의 유지에는 현실의 자원이 들어가고, 데이터센터는 무한히 확장될 수 없다 (자료제공: 슈나이더 일렉트릭)

디지털 기술은 여러 가지로 세상의 효율을 크게 높일 수 있을 것으로 기대되지만, 디지털 기술 기반의 문명을 유지시키는 데는 엄연히 유한한 현실의 자원이 필요하다. 당장 지난 몇 년간 클라우드 컴퓨팅과 디지털 서비스 수요의 증가로 인해 늘어난 데이터센터들은, 만만치 않은 전력 소비량 측면의 문제를 만들고 있다. 이에, 앞으로 디지털 데이터와 서비스 수요가 폭발적으로 증가할 것으로 예상되지만 이를 단순히 현재 수준의 밀도와 효율에서 확장만으로 따라잡는 것은 불가능하며, 데이터센터는 면적과 성능 밀도, 전력 소비량 등에서 절대적인 수치와 상대적인 효율 모두를 큰 폭으로 끌어올려야 하는 어려운 과제에 직면하고 있다.

데이터센터가 현재는 물론 폭발적으로 증가할 앞으로의 디지털 서비스 수요를 현실적으로 감당하기 위해서는, 지속적으로 상면 대비, 소비전력 대비 처리 성능 효율을 서비스 수요의 증가 수준에 상응할 정도로 끌어올릴 필요가 있다. 이에, 데이터센터의 IT 영역에서는 가상화와 소프트웨어 정의 환경으로 인프라의 기본 활용 효율을 극대화하고, 고성능, 고밀도의 최신 서버들을 적극적으로 도입해 소비 전력 대비 성능 효율을 끌어올리고 있으며, 최근에는 특정 워크로드의 성능 효율을 극대화하는 ‘가속기’의 활용에도 적극적으로 나서고 있다. 물론, 서버 자체의 전력 효율 측면에서도, 이미 서버들의 파워 서플라이 효율은 94% 이상을 어렵지 않게 달성하고 있을 정도다.

이에, 데이터센터 전체의 절대적인 소비전력량과 상대적인 전력 효율 모두를 최적화하기 위해서는, IT 영역 뿐 아니라 데이터센터의 시설 부분까지 최적화할 필요가 있다. 이 때 가장 대표적으로 꼽히는 부분이 ‘냉방’인데, 데이터센터의 에너지 효율 척도를 나타내는 PUE에 가장 결정적인 영향을 미치는 것이 바로 이 냉방 효율이다. 이 냉방 효율의 극대화는 냉각 방식과 구조를 최적화하는 방법, 혹은 운영을 위해 달성해야 할 온도 기준을 최적화하는 방법 등을 생각할 수 있는데, 전자의 경우에는 효과적인 냉각을 위해 열원을 격리하는 구조 최적화, 전통적인 에어컨이 아닌 수냉식이나 외기를 직접 활용하는 방법을, 후자의 경우에는 ‘고온 데이터센터’ 환경이 꼽힌다.

이와 함께, 데이터센터가 사용하는 에너지의 절대 소비량을 감축하는 방법으로 재생에너지의 적극적인 활용 또한 고려해 볼 만 하다. 시설 외부에서의 태양열 발전이나, 시설 내부에서 나오는 열 에너지의 활용을 통해 외부에서 공급받는 에너지의 양과 탄소 배출량을 줄일 수 있고, 이는 데이터센터의 경제성과 지속가능성으로 연결된다. 그리고 이 모든 방법들을 운영 환경에서 통합할 수 있는, 데이터 기반의 실행 가능한 통찰력을 제공할 수 있는 플랫폼을 활용하면, 데이터센터 전반의 에너지 효율을 극대화할 수 있으며, 에너지 효율 극대화는 운영 비용 절감과 수익성 향상, 지속 가능성 측면의 향상으로 이어진다.

▲ OCP는 클라우드 시대의 새로운 고밀도 데이터센터 모델을 제시하고 있다 (자료제공: www.opencompute.org)

이제 사회의 핵심 인프라 중 하나가 된 데이터센터는, 고려해야 될 점과 달성해야 될 목표 모두 더욱 까다로워지고 있다. 먼저, 이제 대규모 데이터센터는 천재지변 급 사고가 나기 전까지는 서비스가 중단될 정도로 멈추면 안되고, 천재지변 급 사고가 나더라도 데이터가 손실되는 것은 용납되지 않는다. 그리고 이러한 가용성 목표를 달성하면서도, 최대한 경제적으로 구축하고, 효율적으로 운영될 수 있어야 한다. 그리고 지금까지 이러한 목표들은 양립할 수 없는 것처럼 보였지만, 클라우드 시대로의 변화와 함께, 이러한 목표의 달성을 위한 새로운 방법이 모색되고 있다. 이러한 새로운 방향을 잘 보여주는 프로젝트 중 하나가 바로 OCP(Open Compute Project)다.

OCP의 프로젝트는 데이터센터의 서버 뿐 아니라 서버와 관련된 설비, 운영에 이르기까지 넓은 범위에서 진행되고 있다. 이 중 IT 영역의 ‘서버’와 ‘랙’ 수준의 규격과 사례에서 찾아볼 수 있는 모습이라면, 기존의 랙마운트 폼팩터에 더 많은 서버를 집적하는 ‘고밀도’와, 지금까지 개별 서버에서 운영의 가용성을 위해 반드시 있어야 했던 요소들의 해체와 재구성일 것이다. 특히, 개별 서버를 소형화하면서 RAID를 배제하거나, 개별 서버의 이중화된 파워 서플라이를 과감히 생략하고 수 대의 서버가 랙 캐비닛 수준에서 다중화 구성된 파워 서플라이를 공유하는 구성 등은, 랙 단위 구성을 기본으로 하는 대규모 고집적 데이터센터를 위한 고민의 결과다.

기존의 서버에서 찾기 힘든 이러한 독특한 특징은, OCP가 제시하는 인프라가 기본적으로 가상화된, 가상 머신과 컨테이너, 마이크로서비스 기반으로 운영되는 환경이기 때문에 가능할 것이다. 이 때 워크로드는 개별 시스템에 종속되지 않고 이동할 수 있으며, 컨테이너와 마이크로서비스는 상황에 따라 빠르게 확장, 축소, 재배치가 가능한 서비스 환경을 구현한다. 이에, 단일 서버의 가용성이 높으면 좋지만 지나치게 얽매일 필요는 없으며, 개별 노드나 랙 수준에서 문제가 생기면 워크로드를 다른 위치로 돌리고, 해당 노드나 랙은 단순 교체하는 식으로도 운영할 수 있는 것이다. 또한 데이터는 여러 군데에 분산 저장되어, 장애시 복구와 대체가 용이하게 할 수 있다.

이러한 운영 환경의 특징은 서버와 인프라의 변화를 이끌고 있다. OCP에서의 랙 단위 파워 서플라이는 같은 랙 내의 서버들이 공유하여 사용함으로써, 각 서버가 자체적으로 이중화된 파워 서플라이를 가지는 것보다 파워 서플라이 개수를 줄여 비용을 줄이고 밀도와 효율을 높이면서도 이전 이상의 가용성을 확보할 수 있게 한다. 또한 공유 파워 서플라이에 UPS를 결합하면, 단순한 형태로 많은 수의 서버에 전원 보호를 제공할 수 있어 단순함 측면에서도 유리하다. 물론 이것이 가능한 이유는 OCP의 서버들이 랙에서 벗어나 단독 운영되는 상황을 의도적으로 배제하기 때문인데, 대규모 인프라 단위의 구동으로 인한 ‘규모의 경제’의 혜택을 극대화한 형태다.

▲ OCP 기반 데이터센터에서는, 전력 공급 구조 또한 기존 2N보다 크게 간소화시킬 수 있는 여지가 있다 (자료제공: 슈나이더 일렉트릭)

이러한 클라우드 서비스 모델에 활용되는 OCP의 구축 모델은, 데이터센터의 전력 공급 구조 또한 좀 더 간소화시킬 수 있는 여지를 제공한다. 워크로드가 개별 서버에 종속되지 않고 실시간으로 이동해 배치될 수 있다는 점은, 기존에 사용되던 2N 전력 아키텍처가 제공하는 복잡한 전력 공급 이중화 기반의 무중단 구성이 아니더라도 워크로드의 가용성을 유지할 수 있게 한다. 또한 기존의 대칭형 2N 배전 설계는 모든 상황에 대응하기 위해 사용도가 낮은 중복 요소들이 비용 부담과 효율 저하, 복잡성 등을 만들고 있는데, 이 중 상당 부분은 클라우드 환경과 OCP 모델에서 그리 필요하지 않은 요소일 수 있고, 이를 제거함으로써 비용 측면의 효율을 높일 수 있다.

‘OCP 특화 1N’ 전력 아키텍처는 클라우드 운영 환경과 OCP 아키텍처가 IT 레벨에서 제공하는 가용성 확보 기술을 기반으로, 전력 공급을 위한 이중화 체계를 과감히 생략한 형태다. 이 아키텍처의 특징은 IT 부하에 대한 ‘단일 경로’, 최소 수량의 차단기, 비중앙집중식 UPS와 랙 내부의 1N BBU(Battery Backup Unit) 정도가 있겠다. 이 경우, 전원 공급 체계에 이상이 생기면 일단 BBU가 전원 공급을 대체하는 약간의 시간 동안 문제를 해결하거나, 혹은 워크로드를 다른 위치로 이동시키는 시간을 벌어줌으로써 서비스의 가용성은 유지할 수 있을 것이다. 하지만 업스트림 전력 경로의 구성 요소 대다수의 유지보수 수행에서도 이러한 ‘비상 운영’이 필요하다는 단점이 있다.

‘OCP 특화 2N’ 전력 아키텍처는 1N 전력 아키텍처에서 나타날 수 있는 개별 서버의 가용성 관련 문제를 거의 해결하면서도, 전통적인 2N 아키텍처 대비 아주 간소화된, 비용 효율적인 구성을 제시한다. 이 OCP 특화 2N 전력 아키텍처는 전통적인 2N 아키텍처와 비교할 때, 각 레이어별 이중화를 위한 별도의 경로가 제거되어 있고, 저압부 수준에서 존재하던 중앙집중식 UPS가 없다. 또한 랙 수준에서는 두 개의 경로로 전원 공급이 이루어지지만, BBU는 이 중 하나의 경로에만 연결된다. 이 아키텍처의 장점은 장애나 유지보수 등에서 한 쪽 경로의 이상에도 가용성에 문제가 없다는 점, 그러면서도 대폭 간소화된 백업 구조를 가진다는 점이다.

이 간소화된 OCP 특화 2N 전력 아키텍처는 예상할 수 있는 대부분의 장애에 비용 효율적으로 대응할 수 있다는 것이 장점이다. 먼저, 랙 수준까지 연결되는 경로 중 하나에 문제가 생겨도, 다른 경로가 정상적이면 별 문제가 되지 않는다. 그리고 두 경로 모두에 문제가 생겨도 랙 수준에 구성된 BBU는 문제를 해결하는 동안 약간의 시간을 벌어줄 수 있을 것이다. 비용 측면에서, 기존 2N과 OCP 특화 2N 사이에는 약 25% 정도의 비용 절감 효과가 예상되는데, 여기에는 교차 연결이나 불필요한 차단기, 로드 뱅크, UPS 구성 감소 등 ‘아키텍처 간소화’가 큰 부분을 차지하고 있으며, OCP 특유의 랙 단위 파워 서플라이와 UPS 또한 비용 측면에서 장점을 제공한다.

▲ 점진적 변화를 위한 하이브리드 모델 또한, 전통적 2N 구조보다는 간소화되어 있다 (자료제공: 슈나이더 일렉트릭)

한편, 지금까지 충분히 검증된 데이터센터를 OCP 모델로 한 번에 넘어가기는, 초기 비용 규모나 기존 시설에 대한 투자 보호 문제, 그리고 시설 뿐 아니라 IT 운영 모델까지 전환하는 데서 오는 부담 등을 해결해야 한다. 이에, 현실적으로는 기존의 워크로드는 기존의 IT 인프라 구조에서, 클라우드 기반의 새로운 워크로드는 OCP 모델 기반 인프라 구조로 운영해서, 점차적으로 기존 인프라를 OCP 모델 기반 인프라로 전환해 간다는 계획도 생각할 수 있다. 이 때, 전환이 완전히 끝나기 전에는 두 가지의 인프라 구축 모델이 공존하는, 혼합 부하 환경이 되며, 데이터센터의 시설 구성 또한 OCP 모델의 장점을 취하면서 기존 모델을 수용할 수 있는 ‘하이브리드’ 형태가 필요해진다.

하이브리드 모델의 형태는 기존 2N과 OCP 특화 2N의 중간 정도에 해당하며, 기존 2N 모델을 좀 더 간소화하면서 양 쪽을 모두 포용하는 형태로 갈 수 있다. 하이브리드 모델에서는 고압부와 저압부 수준에 모두 있던 양 경로간 교차 연결이 간소화되며, 저압부 수준에서 양 쪽 경로에 모두 있던 UPS도 한 쪽 경로에서만 준비된다. 기존 서버 모델과 OCP 모델의 공급은 팟 수준의 RPP에서 분기되며, 각 랙 차원에서는 이중화된 경로를 통해 전원을 공급받고, 별도의 BBU는 장착되지 않은 형태다. 이 모델의 핵심은 UPS의 위치로, OCP 특화 2N보다는 비용이 약간 올라가지만 기존 2N보다는 중복되는 요소를 대거 제거해 어느 정도의 비용적 장점을 확보할 수 있다.

양 쪽의 모델에 모두 대응하는 하이브리드 모델은 모든 IT 부하가 OCP 모델일 때, OCP 특화 2N 대비 3% 정도의 비용 프리미엄을 지불해야 하는 것으로 추산되며, 이 프리미엄은 전통적인 모델의 비중이 커질수록 더욱 높아져, 하이브리드 모델에서 전체 인프라가 전통적인 모델인 경우 지불해야 하는 프리미엄은 15% 정도에 이르게 된다. 이러한 프리미엄을 만드는 가장 중요한 요인은 서버당 장착되는 이중화된 파워 서플라이로, 전통적인 모델은 서버 섀시당 두 개의 파워 서플라이가 필요하지만, OCP 모델은 수십 개의 서버 섀시가 랙 차원에서 제공되는 이중화 구성 파워 서플라이를 공유하는 모델로, 중복 구성으로 낭비되는 요소를 최소화할 수 있기 때문이다.

▲ 에코스트럭처 아키텍처는 지속가능한 데이터센터의 구축에서 특별한 전문성을 제공한다 (자료제공: 슈나이더 일렉트릭)

한편, 기존의 2N 모델보다 간소화된 OCP 특화 2N 모델이나 하이브리드 모델 기반으로 데이터센터의 전력 공급 인프라를 구축함에 있어, 인프라 전반의 관리를 통합하고, 이상이 발생했을 때 즉시 이를 발견하고 조치할 수 있는 환경의 중요성은 더욱 높아진다. 두 경로 중 하나의 경로에서만 배터리 백업이 존재하는 상황에서, 서로 다른 이유로 두 경로 모두에서 문제가 생기는 경우도 아주 드물지만 가능할 수도 있고, 이런 가능성을 최소화하는 방법은 문제 발생시 최대한 신속히 이를 발견하고 조치하는 것이다. 또한 더 나아가, 데이터 기반의 선제적 예방 정비는 데이터센터의 가용성을 완벽에 가깝게 유지하면서도, 운영 비용 측면에서도 최적화를 기대할 수 있는 기술이다.

슈나이더 일렉트릭의 ‘에코스트럭처(EcoStruxure)’ 플랫폼은 데이터센터가 당면한 과제인, 탄소 배출량이 적고 에너지 효율이 높은 시설의 구현을 위한 모든 구성 요소를 연결하는 중요한 위치에 있다. 이 플랫폼은 시설 내부에서 전원의 인입부터 핵심 부하에 이르는 모든 경로에 있는 주요 시설들을 연결하고 가장 효율적으로 운영할 수 있도록 통찰력을 제공하며, 재생에너지 활용을 위한 시스템과의 유연하고 매끄러운 통합까지 구현할 수 있게 한다. 이를 통해, 시설이 가장 최적의 상태로 운영될 수 있도록 각 구성요소들을 실시간 제어하고, 문제 발생시 최대한 빠르게 조치할 수 있도록 지원하며, 더 나아가서는 데이터 기반의 예측 정비를 통해 인프라 전반의 가용성을 극대화할 수 있게 한다.

▲ 스웨덴 팔룬의 EcoDataCenter는 이 ‘지속 가능한 데이터센터’ 구축의 좋은 사례다 (자료제공: 슈나이더 일렉트릭)

스웨덴 팔룬에 있는 EcoDataCenter는 이러한 고효율의, 지속 가능한 데이터센터 구성에서 주목할 만한 모범 사례다. 이 데이터센터는 슈나이더 일렉트릭의 ‘에코스트럭처’ 플랫폼을 중심으로 해 높은 에너지 효율의 시설에 재생에너지 활용을 통합함으로써, 투엔드 이중화 구성에서도 EER 132와 PUE 1.15를 달성했다. 특히, 재생에너지 활용에서, 이 데이터센터는 서버실에서 할 수 있는 한 많은 열을 포집해, 여분의 저등급 폐열을 근처의 현지 바이오 연료 시설과 펠릿 공장에 보낸다. 이를 통해 기후변화를 최소화하기 위한 화석 연료 사용과 탄소 배출의 최소화는 물론, 궁극적으로는 에너지 비용을 낮추어 경쟁력 있는 가격을 유지할 수 있게 한다.

이 데이터센터의 구축에는 슈나이더 일렉트릭의 ‘에코스트럭처 for Cloud & Service Providers’가 활용되었으며, 에코스트럭처 아키텍처의 개방성을 활용해 슈나이더 일렉트릭 및 타사의 하드웨어, 소프트웨어들을 완벽하게 연결하고, 플랫폼에서 제공하는 분석과 서비스를 통해 장비를 모니터링, 운영할 수 있게 했다. 또한 에코스트럭처 IT 어드바이저(IT Advisor)를 통해 고압 배전반, 갤럭시 VX UPS 유닛, Masterpact MTZ 차단기, 스크롤 컴프래서, CRAH 유닛, 리튬이온 배터리, Uniflair 냉각장치 등의 다양한 중요 제품을 결합했으며, 이는 데이터센터의 온도 조절 등 운영 전반을 더욱 효과적으로 할 수 있게 해, 시설 전반의 기후 긍정적 결과에도 기여하고 있다.

또한 데이터센터의 효율성과 가용성을 모두 극대화하는 데 있어, 갤럭시 VX UPS는 ‘이컨버전(ECOnversion)’ 모드로 최대 99% 이상의 효율과 안정적인 전원 보호를 동시에 제공하여, 시설 전반의 소비 전력이나 전기실의 냉각 요구를 줄일 뿐 아니라, 고객이 활용할 수 있는 에너지를 더욱 확보할 수 있게 지원한다. 또한 에코스트럭처 플랫폼을 중심으로 연결된 데이터센터의 주요 시설들은, 커넥티드 센서 및 미터기 모니터링을 통해 시설 온도를 더욱 효과적으로 조절할 수 있고, 시설에 문제가 발생했을 때도 이를 빠르게 파악하고 복구할 수 있도록 서비스를 지원해, 궁극적으로는 데이터센터의 경제성을 극대화할 수 있게 돕는다.

디지털 기술과 IT가 세상의 지속 가능성을 높이는 핵심 기술이 되면서, 데이터센터의 지속 가능성을 높이는 것은 앞으로의 디지털 시대를 위한 중요한 과제가 되었다. 이제 데이터센터는 성능이나 가용성 등의 IT 측면뿐만 아니라, 효율성과 경제성, 지속 가능성 등 다양한 측면에서의 요구 사항들까지 모두 만족시켜야 한다. 그리고 앞으로의 데이터센터에 요구되는 부분들을 충족시키는 방법을 찾아 나가는 여정에 있어, 슈나이더 일렉트릭과 파트너, 에코스트럭처 플랫폼과 생태계는 현재와 미래 모두에서 가장 적합한 형태의 솔루션을 제공하고, 지속 가능성을 극대화할 수 있는 검증된 역량을 제공해, 궁극적으로는 기업의 미래 경쟁력 측면을 극대화할 수 있게 돕는다.


Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright © ACROFAN All Right Reserved