ACROFAN

인텔, 1억 개 뉴런 갖춘 뉴로모픽 연구 시스템 ‘포호이키 스프링스’ 발표

기사입력 : 2020년 03월 19일 21시 32분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
인텔(Intel)은 3월 19일, 1억 개의 뉴런 구성을 제공하는 최신 뉴로모픽 연구 시스템 ‘포호이키 스프링스(Pohoiki Springs)’의 현황을 소개하는 미디어 브리핑을 진행했다. 컴퓨팅 능력 향상을 위한 새로운 방향성에 대한 연구의 일환인 ‘뉴로모픽(Neuromorphic) 연구 시스템’인 이 ‘포호이키 스프링스’는 5U 섀시에 768개의 로이히(Loihi) 뉴로모픽 연구 칩을 장착해 1억 개의 뉴런 연산 성능을 제공하며, 전력 소비 또한 500W 미만이다.

이 시스템의 기반이 되는 로이히 뉴로모픽 연구 칩은 인간의 뇌에서 영감을 얻어 구성되었으며, 128개 코어 설계는 SNN(Spiking Neural Network) 알고리즘에 최적화되어 있고, 13만여개의 뉴런은 서로 독립적으로 실행되면서 다른 뉴런과 통신하고, 해당 뉴런의 전기 상태를 변경할 수 있다. SNN에 맞게 특화된 로이히 칩은 처리가 까다로운 워크로드를 기존 프로세서 대비 최대 1,000배 빠르고, 최대 10,000배 효율적으로 처리할 수 있다. 또한 매우 낮은 전력 소비와 우수한 성능 및 용량 사양을 바탕으로, 자율 작동 및 지속적 학습이 요구되는 시스템의 구조화되지 않은 환경에서도 매우 빠른 속도의 학습이 가능하다.

‘포호이키 스프링스’는 인공지능 관련 문제 뿐만 아니라 광범위한 어려운 연산 작업을 해결할 수 있는 잠재력을 확인하기 위해 로이히 아키텍처를 확장한 시스템이며, 극한 병렬과 비동기 신호의 특징을 갖추고 특별한 유형의 문제를 다루는 데 있어 매우 빠르고 효율적으로 접근할 수 있다. 이 시스템은 5U 랙마운트 섀시 정도의 크기에 768개의 로이히 칩을 탑재, 약 1억 개의 뉴런 연산 성능을 갖추었으며, 이 로이히 칩들은 인텔의 FPGA Arria10 기반의 보드를 통해 전통적인 컴퓨팅 시스템과 연결되어 활용되며, 전력 소비량은 300W 수준으로 소개되었다. 이 시스템은 인텔 뉴로모픽 리서치 커뮤니티(INRC) 소속 연구원들이 활용할 수 있도록 클라우드 서비스 기반으로 제공될 계획이다.

▲ 인텔의 ‘포호이키 스프링스’가 가진 뉴런의 규모는 이제 작은 포유류의 뇌 수준에 이르렀다 (자료제공: Intel)

▲ 로이히 뉴로모픽 연구 칩은 기존의 컴퓨팅 구조와는 사뭇 다른 독특한 구조를 가지고 있다 (자료제공: Intel)

마이크 데이비스(Mike Davies) 인텔 뉴로모픽 컴퓨팅 랩 디렉터는 이 자리에서, CPU나 GPU 등의 전통적인 범용 프로세서는 매우 정밀한 수학적 연산과 같이 인간이 하기 어려운 작업에 능숙한 특징을 가지지만, 자동화에서 인공지능에 이르기까지 새로이 등장하는 워크로드들은 기존의 범용 프로세서가 처리하기에 비효율적인 특징을 지니고 있다고 지적했다. 이에 인텔은 다양한 워크로드와 데이터를 더욱 빠르고 효율적으로 다룰 수 있도록, 컴퓨팅에서의 새로운 방향성과 아키텍처를 찾기 위한 다양한 연구를 진행하고 있으며, ‘뉴로모픽 컴퓨팅’ 또한 이런 노력의 일환이라고 밝혔다.

뉴로모픽 컴퓨팅은 신경과학의 최신 통찰력을 적용해 컴퓨터 아키텍처를 근본부터 전면적으로 다시설계하며, 결과적으로 칩의 구조는 인간의 뇌와 더 유사한 형태를 가지게 된다. 이 뉴로모픽 시스템은 뉴런의 조직, 통신 및 학습 능력을 하드웨어 수준으로 구현하며, 현재 인텔의 뉴로모픽 리서치 칩인 ‘로이히’는 칩 수준에서 약 13만 개의 뉴런과 1억 2,800만 개의 시냅스, 칩 내부적으로 학습 기능을 갖추고 있다. 또한 이 ‘로이히’는 전통적인 컴퓨팅 아키텍처에서는 분리되어 있던 메모리와 컴퓨트 기능이 통합된 형태이며, 부동소수점 연산이나 곱셈기 등의 전통적인 컴퓨팅 구조에서는 필수적이던 유닛들이 없는 등, 기존의 아키텍처와는 전혀 다른 접근법을 취하고 있다는 점도 중요한 특징이다.

인텔 랩은 이 뉴로모픽 컴퓨팅의 생태계를 지원하기 위한 학계, 정부, 업계간 공동 연구 노력의 일환으로 INRC(Intel Neuromorphic Research Community)를 설립한 바 있으며, 최근 액센추어(Accenture), 에어버스(Airbus), GE, 히타치(Hitachi) 등이 합류하는 등, 현재 학계, 정부, 업계 등에서 90개 이상의 조직이 협력하고 있다. 그리고 새롭게 발표된 최신 뉴로모픽 연구 시스템 ‘포호이키 스프링스’ 또한 클라우드 기반의 시스템으로 INRC 소속 연구원들에 사용할 수 있도록 제공될 계획이며, 이 시스템을 통해 신경망에서 영감을 받은 알고리즘을 개발하고 특성화할 수 있는 도구를 활용, 실시간으로 데이터를 처리하고 문제를 해결하며 적응, 학습할 수 있게 한다.

▲ 뉴로모픽 컴퓨팅은 훈련량이 극도로 부족한 상황의 딥러닝에서도 높은 정확도를 제공할 수 있다 (자료제공: Intel)

뉴로모픽 연구의 핵심 과제로는 인간의 유연성에 필적하며, 인간 두뇌의 에너지 효율성 수준에서 구조화되지 않은 자극으로부터 학습하는 기능을 연구하는 것이 꼽힌다. 뉴로모픽 컴퓨팅 시스템의 컴퓨팅 구성 요소는 논리적으로 뉴런과 유사하며, SNN(Spiking Neural Network)은 생물학적 두뇌에 존재하는 자연적인 신경망을 모방하기 위해 이러한 요소를 배열하는 새로운 모델이다. SNN의 각 뉴런은 서로 독립적으로 실행되며, 이를 통해 네트워크의 다른 뉴런에 펄스 신호를 전송하고 해당 뉴런의 전기 상태를 직접 변경할 수 있다. 신호 자체 내 정보와 타이밍을 인코딩하는 SNN은 자극에 응답하여 인공 뉴런 사이의 시냅스를 동적으로 재매핑함으로써 자연적인 학습 프로세스를 시뮬레이션한다.

인텔은 뉴로모픽 컴퓨팅의 장점으로, 까다로운 문제의 해답을 찾는 데 있어서의 ‘순발력’과 ‘짧은 지연 시간’을 꼽았다. 기존의 시스템들은 까다로운, 규모가 큰 문제의 해결을 위해 배치 형태의 처리를 수행하는데, 이 경우 처리량은 크지만 순발력과 지연 시간 면에서는 불리한 면이 있다. 그리고 이러한 특징은 내비게이션이나 실시간 쇼핑 추천 등의 시스템에서 효과적으로 활용할 수 있을 것으로 기대했다. 이와 함께, 대규모의 서비스 수요를 소화하는 데 있어 뛰어난 에너지 효율을 보여주는 특징은, 데이터센터에서의 전력 소비와 냉각 등에서의 도전 과제를 극복하는 데 새로운 길을 제시할 수 있을 것이라고 덧붙였다.

한편, 인텔은 코넬대학 연구팀과 함께 한, 로이히 테스트 칩을 활용해 10 가지 냄새에 대한 신경 반응을 빠르게 학습한 알고리즘 연구가 네이처 머신 인텔리전스(Nature Machine Intelligence)에 게재되었다고 소개했다. 이는 동물의 생물학적 후각 체계를 연구해, 동물이 냄새를 맡을 때 뇌에서 일어나는 전기적 활동을 측정, 이를 기초로 해 알고리즘을 도출하고 로이히 테스트 칩에 직접 구성한 것으로, 냄새를 맡는 것과 연결되는 실제 후각 신경구의 기능을 도출해 로이히의 뉴럴 네트워크 기능을 통해 실제로 작동할 수 있도록 한 것이다.

이 사례에서, 인텔과 코넬대학 연구팀은 72개의 화학 감지 센서들을 통해 10개의 기체 상태의 냄새데이터 집합을 수집, 스파이크 형태의 신호에 대한 타이밍 코드 패턴을 기반으로 훈련된 냄새를 식별할 수 있었다. 인텔은 이 사례에서, 인텔이 활용한 알고리즘이 기존 머신 러닝 알고리즘 대비, 적은 훈련으로도 높은 성능을 보였다는 것을 강조했다. 한 세트의 훈련 과정을 수행했을 때, 인텔의 EPL 알고리즘은 기존의 DAE 대비 40% 높은 성능을 보여준 바 있는데, 로이히의 경우 단 한 개의 샘플만으로도 현재의 딥러닝 솔루션이 3,000개 가량의 데이터로 트레이닝 후에 얻을 수 있는 정확도인 92%에 도달할 수 있었다는 것이다.

▲ ‘포호이키 스프링스’는 총 768개의 로이히 칩으로, 1억 뉴런 규모의 플랫폼을 구성했다

▲ ‘포호이키 스프링스’에는 32개 로이히 칩 구성의 ‘나후쿠’ 보드가 총 24장 사용되었다

인텔의 ‘포호이키 스프링스’는 5U 랙마운트 규격의 섀시에 768개의 로이히 뉴로모픽 연구 칩과 1억 개의 스파이키 뉴런을 내장한 시스템으로, 기존의 64개 칩을 지닌 ‘포호이키 비치’에서 12배 확장되었다. 이 ‘포호이키 스프링스’가 가진 1억 개의 뉴런은 이제 곤충 수준의 뉴런 규모를 가진 로이히의 신경 능력을 작은 포유류의 뇌 수준으로 증가시킨 것이며, 향후 더욱 크고 정교한 뉴로모픽 워크로드를 처리할 수 있도록 지원할 수 있는 단계로 가는 중요한 계기라는 의미를 부여했다. 그리고 이 시스템의 로이히 칩은 Arria 10 FPGA 호스트 보드 위에 구성되어 기존의 전통적인 컴퓨팅 시스템과 연결되며, 로이히 칩 간에는 메시 형태의 연결을 통해, 칩과 칩 간의 메시지 교환에서 효율성을 높였다고 설명했다.

‘포호이키 스프링스’는 5U 랙마운트 구조에 768개의 로이히 연구 칩, 1억 개의 스파이키 뉴런을 내장하고도, 전력 소비량은 300W 수준으로 구현된 것이 특징이다. 또한 이 시스템은 클라우드 기반의 서비스 형태로 INRC 소속 연구원들에 제공될 예정이며, 클라우드 인프라에서의 연결을 위한 이더넷 네트워킹과 유연한 파티셔닝 기능도 갖추고 있다고 언급되었다. 한편, 이 시스템은 현재 연구 단계이며, 전통적인 컴퓨터 시스템의 대체보다는 아주 특수한 성격을 가진 워크로드의 효과적인 처리에 유리하고, 상용화 시점에서 해결해야 할 과제로는 이러한 특정 분야를 위한 솔루션의 특징을 좀 더 ‘범용적’으로 활용할 수 있는 방안을 꼽았다.

현재 로이히는 범용 프로세서로 처리하기 까다로운 특정 워크로드를 기존 대비 100배 이상 빠르고, 수천 배 적은 에너지로 처리할 수 있는 가능성을 제공하고 있다. 그리고 INRC는 로이히를 위해, 제약 조건 만족 문제(CSP: Constraint Satisfaction Problem), 그래프 및 패턴 검색, 최적화 문제 등을 해결하기 위한 알고리즘을 개발하고 있으며, 이를 통해 현실 세계의 다양한 문제들을 새로운 방법으로, 새로운 차원의 성능으로 해결할 수 있는 방안을 제시한다. 한편, 인텔은 이 ‘로이히’ 기반 시스템으로, 엣지 프로세싱을 위한 두 개의 로이히 칩 구성의 카포오 베이(Kapoho Bay), 32개의 로이히 칩을 갖춘 나후쿠(Nahuku) 등이 있다고 덧붙였다. 특히 ‘나후쿠’ 보드는 ‘포호이키 스프링스’의 구성 기반이 되며, 포호이키 스프링스는 32개 로이히 구성의 나후쿠 보드를 열당 3개씩, 8열 장착해 총 768개 로이히 칩 구성을 만든다.

시스템의 확장 측면에서, 인텔은 1억개의 뉴런 구성까지 확장하는 것은 비교적 간단했지만, 아키텍처에 대한 기초적인 문제보다는 트랜지스터에서부터 기존의 범용 컴퓨팅 환경에서는 사용할 수 없는 부분들까지 전체적인 소프트웨어 시스템 스택을 다시 구축하는 문제 등이 ‘포호이키 스프링스’의 구성 과정에서 확장성과 가용성 측면에서 마주했던 과제들이었다고 소개했다. 또한 칩 연결 스케일이 커짐에 따라, 뇌 부피의 80%를 차지하는 ‘백색 물질’과 같은, 로이히 칩간 효율적인 장거리 통신 방법에 대한 연구를 추가 확장에 대한 당면 과제로 꼽았다.

Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright © ACROFAN All Right Reserved