ACROFAN

GIST AI대학원 슈퍼컴퓨팅센터, 슈나이더 엣지 데이터센터로 ‘꿈꾸는 아이’ TOP500 이룬다

기사입력 : 2022년 11월 02일 20시 49분
ACROFAN=류재용 | jaeyong.ryu@acrofan.com SNS
점차 복잡해지는 각종 과제를 해결하기 위해, 기하급수적인 계산 속도의 향상은 IT 산업계에 끊임없이 제시되어 온 미션이다. 전통적인 방법론인 CPU에 기반한 컴퓨팅 노드의 고도화와 확장은 기본. 여기에 GPU 기반 컴퓨팅, 양자 컴퓨터 등이 접목되면서, 과거에 달성하지 못한 수준에 도달하고 넘어서는 사례가 세계 각지에서 속속 발표되는 실정이다.

슈퍼컴퓨터는 그 수준과 보유 자체가 ‘국력’에 버금가는 위상을 지닌 지 오래다. 특히 10위권 슈퍼컴퓨터 중 과반을 차지하는 GPU 기반 슈퍼컴퓨팅은 지난 2006년 10월에 엔비디아가 발표한 CUDA(Compute Unified Device Architecture)가 그 뿌리다. 미국 스탠포드 대학에서 시도한 Folding@home을 시작으로 SETI@home, Einstein@home 등으로 확산이 되어 슈퍼컴퓨터의 대중화를 전세계적으로 실현시킨데 이어, 최근에는 텐서 코어(Tensor Core) GPU로 제작된 A100 GPU가 TOP500 리스트에 속속 모습을 드러내는 기염을 토하고 있다.

■ 광주과학기술원, ‘꿈꾸는 아이’로 공용 인프라와 TOP500 두 마리 토끼 잡는다

▲ 광주과학기술원에서 인공지능 연구와 산업 고도화를 목표로 슈퍼컴퓨터 공용 인프라 구축에 발 벗고 나섰다.

▲ 센터 내에 구축된 ‘꿈꾸는 아이’ 슈퍼컴퓨터센터는 원 자체적인 연구개발과 더불어 호남권 산업 발전에도 이바지하고 있다.

광주과학기술원(Gwangju Institute of Science and Technology, 이하 GIST)은 지난 1995년 정부출연 연구중심 대학원으로 출발한 이래로, 호남권의 과학 발전에 이바지해 왔다. 특히 최근에는 광주광역시에 입지한 주요 산업에 필수적인 혁신 기술들을 중점적으로 배양해 전문인력과 최첨단 산학협력을 주도적으로 이끌고 있다.

이중에서도 융합기술원 산하 AI대학원은 2020학년도에 개설되어 명칭대로 ‘인공지능’에 최고급 두뇌들을 몰입하게 만드는데 일조하고 있다. 인공지능 분야 최고급 인재들을 양성한다는 본연의 목적과 더불어, 광주광역시 전역에서 필요로 하는 3대 산업(자동차, 헬스케어, 에너지) 분야에 특화된 지역의 클라스터이자, AI 클라스터링 미션 수행의 첨병이 되어 있다.

김종원 GIST AI대학원 원장은 “자동차, 헬스케어, 에너지 부분에 다 특화하는 지역의 클라스터링, AI 클라스터링 미션 등과 연계해 학생들을 교육하고 연구하고 창업하는 밸런스 있게 키워보려는 노력을 하고 있습니다”라고 본원을 소개하고, “학생들의 심층노력을 위해서는 컴퓨팅 파워가 필요합니다. 저희 슈퍼컴퓨팅센터에서는 HPC, AI 공용 인프라라고 부르는, 그리고 TOP500 등재될 있는 수준으로 준비하고 있습니다. 그래서 그런 컴퓨팅 파워를 가지고 대학원생들의 연구, 개발, 실증 등을 지원하기 위해서 움직이고 있습니다”라고 덧붙였다.

▲ 김종원 GIST AI대학원 원장은 센터 설립 당시 청사진 수립부터 향후 미래연구 역량 배양까지 전방위적으로 진두지휘하고 있다.

■ 슈나이더 일렉트릭 엣지 데이터센터의 도입... 현재는 물론 미래의 미션까지 해결

학술 및 교육 목적과 더불어, GIST AI대학원에서 구축한 슈퍼컴퓨팅센터는 원과 지역 산업계가 공동으로 활용할 수 있는 공용 인프라 특성을 겸비하고 있다. 이에 ‘꿈꾸는 아이’라고 명명된 GIST 슈퍼컴퓨팅센터는 TOP500 리스트에서 비중을 늘리고 있는 GPU 기반으로 처리용량을 확보해 6PF(32bit Max) 연산 능력과 10PB(1PB Flash) 저장용량을 확보해 광주는 물론 호남권 수위의 슈퍼컴퓨팅 역량을 달성해 냈다.

현재 구축된 데이터센터는 현재의 수치에서 끝나는 것이 아니라 향후 지속적인 보강이 예정되어 있다. 자연히 이와 연계된 처리용량의 확보와 더불어 운용 및 확장에 대한 고민은 실존적인 문제로 대두, 관련해 해결책으로 슈나이더 일렉트릭의 ‘엣지 데이터센터’ 솔루션 도입이 단행되었다.

▲ GIST 내 슈퍼컴퓨팅 인프라는 슈나이더 솔루션으로 그 기반을 구축해, 향후 프로세싱 및 스토리지 역량을 지속적으로 확장하는데 최적화되어 있다.

GIST가 채택한 부분으로는 산업표준 기반 랙 인프라와 Easy Rack PDU(Power Distributor Unit) 등이 대표적이다. Easy PDU 제품군은 표준 랙마운트 규격 기반의 엣지나 데이터센터 인프라에 가장 필요한, 높은 부하의 전력량을 안정적으로 공급할 수 있는 신뢰성과, 인프라의 효율적인 운영을 위한 기본적인 모니터링 기능 등의 핵심 가치를 안정적으로 제공하는 제품군으로, 엣지 인프라에서 고밀도 데이터센터 환경에 이르기까지 다양한 환경에서 활용할 수 있는 기술적 특징을 제공한다.

여기에 더해 솔루션 레벨로 더해진 요소들도 특징적이다. 인프라 전반의 통합 관리를 구현할 수 있는 ‘에코스트럭처’ 플랫폼이 대표적. Easy 랙 PDU 포트폴리오 중 네트워크를 통한 모니터링이 가능한 Metered 나 Switched 유형 제품의 경우, 에코스트럭처 기반의 데이터센터 시설 전반의 관리 체계에 통합될 수 있어, 이를 바탕으로 데이터 기반의 더욱 정교한 운영 환경을 구현한다. GIST 슈퍼컴퓨팅센터에는 ‘Metered’ 유형이 채택되었는데, 현장은 물론 원격으로도 실시간 정보 취득과 모니터링, 이벤트 알람 등이 가능해 중앙집중된 효율적 관제가 가능하다.

김종원 GIST AI대학원 원장은 “GIST 슈퍼컴퓨팅센터 규모는 공용 인프라, 공개적으로 여러 사람들이 활용할 수 있는 인프라 입장으로는 국내에서 가장 큰 크기로 지금 알고 있습니다. 저희가 곧 지역시범 가동을 시작하는데, 이렇게 되면 저희가 할 수 있는 매우 중요한 AI 분야에서 굉장히 중요한 규모가 있는 컴퓨팅을 지원하는 입장에서는 굉장히 유일한, 그리고 실용적으로 문제를 풀 수 있는 굉장히 현실적인 인프라가 될 것이라고 기대하고 있습니다”라고 말했다.

▲ 김종원 GIST AI대학원 원장은 GIST 자체적인 프로젝트는 물론, 지역사회 산업 발전에도 ‘꿈꾸는 아이’가 기여할 것이라고 역설했다.

■ 강력한 GPU 기반 슈퍼컴퓨팅센터의 현안들, 슈나이더 일렉트릭 솔루션이 해결한다

광주 인공지능 연구와 혁신을 이끄는 ‘꿈꾸는 아이’의 연산 능력은 320장 분량의 엔비디아 A100 GPU를 통해 실현되었다. GPU들이 다수 탑재되면서 전력을 많이 쓰게 되었는데, 관련해 전력 활용을 정확하게 추적하면서 관리할 필요가 생겼다. 이를 효과적으로 해결할 수 있게 해준 것이 바로 랙 별로 설치된 슈나이더 일렉트릭 PDU 제품군들이다. 제일 앞 단계에서부터 전력량을 잘 정리해주면, 이를 갖고 운영을 최적화시킨다.

‘꿈꾸는 아이’는 광주광역시는 물론 호남권에서 가장 대규모로 단행된 슈퍼컴퓨터 인스톨레이션이다. 이는 앞으로도 유효한 방향으로, 전력 사용과 향후 확장성이라는 미션이 지속된다. 이러한 측면에서 GIST는 슈나이더 일렉트릭 솔루션이 지닌 확장성을 주목했다. 특히 전력량 통제를 중시해 AI 기반으로 수시 모니터링을 하고 전기 사용 측면에서의 비용 절감이라는 미션을 성공적으로 수행 중이다.

▲ 지금 구축된 제원으로도 호남권 최고를 점하고 있으나, 향후 확장계획을 감안해 상면공간 등 역량 보강이 예정되어 있다. 이를 위해 슈나이더 일렉트릭의 솔루션들이 채택되었다.

이에 슈나이더 일렉트릭 코리아 IT 비즈니스 사업본부 데이터센터 사업팀 최동훈 매니저(부장)은 “광주과학기술원 슈퍼컴퓨팅센터는 슈나이더의 엣지 데이터센터로 구성되어 있습니다. 커넥티드 제품인 랙과 지능형 PDU, 엣지 컨트롤링 데이터센터 엑스퍼트를 통해 관리 및 운영되며, 추후 앱 분석 서비스로도 업그레이드 될 예정입니다. 이를 통해 좀 더 고도화된 데이터센터를 구축할 예정입니다”라고 현황과 향후 로드맵을 설명했다.

현장에서 채택한 주요 솔루션으로는 네트워크나 로컬 LCD 디스플레이를 통해 연결된 부하들을 실시간으로 확인할 수 있는 ‘Metered’ 유형의 제품인 32A 용량의 EPDU1132M 모델이 있다. 기존의 AP8853 모델을 대체하는 이 EPDU1132M은 IEC309 플러그를 통한 입력, 20개의 C13, 4개의 C19 콘센트 출력 구성을 제공하며, Hydraulic-magnetic 방식의 회로 차단기를 갖추고 있다. 또한 연결된 부하들을 PDU 수준에서 모니터링하기 위해 LCD 디스플레이와 1개의 버튼을 갖추고 있으며, 온도, 습도 센서를 위한 I/O 포트와 함께 네트워크 포트를 갖추고 있어 원격 모니터링 기능도 사용할 수 있다. 원격 모니터링의 경우 SNMP 프로토콜과 함께 http/https 형식을 지원해, 인프라 전반의 관리 환경에 통합하거나, PDU 단위의 개별 접근 모두 가능하다.

더불어 이 솔루션들은 슈나이더 일렉트릭의 폭넓은 랙 인클로저 포트폴리오와 함께 하면서 편의성과 유연성이 배가되었다. 슈나이더 일렉트릭은 데이터센터 등 전통적인 IT 환경을 위한 표준형 랙 인클로저에서부터, 사무실 등을 위한 방음형 랙, 열악한 운영 환경을 위한 방진 랙, 벽에 장착할 수 있는 월마운트형 랙 등 폭넓은 포트폴리오를 제공하고 있으며, PDU를 포함한 다양한 옵션 조합으로 설치 환경에 가장 적합한 랙 인클로저를 구성, 사전 구성된 상태로 공급할 수 있다. 이러한 전방위적인 구성안 중에서, ‘꿈꾸는 아이’는 예산과 향후 미래계획까지 감당 가능한 형태로 최적의 슈나이더 솔루션 구성을 단행했다.

▲ ‘자율주행 및 초고성능컴퓨팅 전문센터’ 관제실은 데이터센터 바로 옆에 배치된 워룸 타입으로 설계되어 실시간 모니터링과 즉각조치에 최적 운영 중이다. 여기에서도 슈나이더의 소프트웨어와 서비스가 중요한 역할을 맡고 있다.

한편, 이상적으로 설계된 GIST의 ‘꿈꾸는 아이’ 슈퍼컴퓨팅센터는 최근 지정된 자율주행 전문센터 등에서도 활약할 것으로 예상되고 있다.

이에 김종원 GIST AI대학원 원장은 “슈퍼컴퓨팅 전문센터에서는 지금보다 용량이 두 배 이상 필요할 것으로 예상하고 있습니다. 그렇게 되면 전력 사용량도 단순하게 보면 두 배 이상으로 늘어날 거고요. 전체적인 문제를 갖다가 지금같이 해서는 저희가 너무 올라가는 전기요금을 감당하기 어려울 것 같다고 생각합니다. 그래서 최적의 AI 기법을 도입하면서, 슈나이더의 어떤 솔루션들이 확장되어서 저희가 하는 시스템들을 가장 효율적이면서도 경제적으로 관리할 수 있게 통합적이고 발전된 모습이 되는 것을 기대하고 있습니다”라고 말했다.

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved