새 ARM 프로세서, 가상현실 겨냥한 포트폴리오
상태바
새 ARM 프로세서, 가상현실 겨냥한 포트폴리오
  • by 이상우

ARM이 차세대 CPU 코어 ‘코어텍스-A73(Cortex-A73)’과 새로운 GPU 아키텍처 ‘바이프로스트(Bifrost)’가 적용된 GPU 코어 ‘말리-G71(Mali-G71)'을 발표했다. 이들 신제품은 10나노 공정으로 생산되는 시스템온칩(SoC)에 탑재될 것으로 전망된다. 그렇게 되면 내년 나오는 플래그십 스마트폰의 CPU 성능은 지금보다 1.3배 향상되고, GPU는 1.5배 개선돼 가상현실(VR, Virtual Reality) 대응의 다양한 모바일 기기의 출현이 기대된다는 것이 ARM의 설명이다.
전 세계 스마트폰의 98%가 ARM의 손길을 거쳐 시장에 나온다는 점에서 모바일의 가상화 흐름이 탄력을 받을 것이다. 애플, 삼성, 퀄컴, 엔비디아 등 애플리케이션 프로세서(AP) 제조사 대부분이 ARM에 밑그림을 맡겨서다. ARM은 반도체 지적 재산권(IP)를 제공하고, 이들 제조사는 그것을 바탕으로 자신들에게 맞게 수정, 생산해 스마트폰을 포함 태블릿, 노트북 등에 탑재한다.

코어텍스-A73은 ARM의 최상위 플래그십 CPU 코어로 지난해 선보인 코어텍스-A72 업그레이드 버전이다. 동일 전력에서 성능이 30% 높아졌고, 동일 성능에서는 전력 효율이 30% 개선됐다. 그리고 코어 크기도 작아졌다. 코어당 차지 면적은 0.65㎟ 이하로 좁다. 성능과 효율 모두 향상되었지만 상대적으로 성능을 중시하는 코어텍스-A72와 달리 신제품은 전력 효율 개선에 중점을 뒀다. 포지셔닝에 변화가 있다는 이야기다.



적은 전력으로 최대 성능 내는 설계

코어텍스-A73의 가장 큰 특징은 2명령 디코드 슈퍼 스칼라 파이프라인이다. 코어텍스-A72가 3명령 디코딩이었으니 오히려 명령 디코딩 대역은 3분의 2로 줄었다. 이것만 보면 코어텍스-A9 수준으로 후퇴한 것 같다. 더 많은 명령을 동시에 디코딩 할 수 있으면 더 많은 명령의 병렬 실행이 가능해서다. 명령 디코드 수는 클럭당 성능에 크게 영향을 미친다. 더 빠르다는 얘기다. 일반적으로 높은 성능의 CPU는 더 많은 명령을 디코딩 할 수 있는 구조를 고집하는 것은 바로 이 때문이다. 그런데 ARM은 코어텍스-A73의 명령 디코드 대역을 역으로 줄였다. 왜 그랬을까. 스마트폰이라는 작은 형태에서 지속적인 성능 향상이 가능한 설계로 방향 전환을 한 것이다. 결과적으로 코어텍스-A73은 역대 ARM 플래그십 CPU 코어 가운데서 가장 크기가 작고 반대로 성능 효율이 가장 우수하다. 클럭당 성능도 3명령 디코딩의 코어텍스-A72에 밀리지 않는다.

ARM코리아 정성훈 부장은 ARM의 3세대 플래그십 CPU(코어텍스-A73, A72, A57) 코어의 성능을 비교한 슬라이드를 예로 A73의 성능이 코어텍스-A72 대비 30%, A57보다는 110% 향상됐다고 강조했다. 포인트는 이것이 스마트폰이 허용하는 CPU 코어 전력 범위 즉, 코어당 750mW(밀리와트) 기준이라는 점이다. 10나노 공장의 코어텍스-A73는 이 전력으로 동작 클럭 2.8GHz를 지속적으로 유지, 최대 성능을 발휘한다. 코어텍스-A72는 2.5GHz의 동작 클럭은 동일하지만 이 클럭이 750mW 안에서 줄곧 작동하지 않는다. 결과적으로 A73 쪽이 30% 앞선 성능을 제공한다. 1.5GHz의 A57 보다는 2배 이상 높은 성능이다. 정리하면 스마트폰이라는 제한적인 전력 범위 내에서 코어텍스-A73의 실효 성능은 최고다. 물론 CPU 코어의 전력 범위를 제한하지 않는다면 얘기가 달라진다. 동일한 10나노 공정으로 만든 코어텍스-A72가 훨씬 높은 성능을 발휘할 것이다. 요컨대 서버처럼 전력 사용의 제약이 적은 분야에서는 코어텍스-A72를, 스마트폰 등 모바일 기기에서는 코어텍스-A73이 활용될 것으로 전망된다.

[스마트폰은 매해 점점 얇아지고 있다. CPU 코어의 차지 면적과 발열은 반비례해 줄어들어여 한다.]


칩 크기가 작아진 것도 코어텍스-A73의 특징이다. 코어당 차지 면적은 0.65㎟ 이하다. 코어텍스-A72와 비교하면 46% 줄었고 A57보다는 70% 작아진 것이다. 역산하면 A72 코어 면적은 1.2㎟, 20나노 공정의 A57는 2.2㎟다. 이 또한 CPU 코어가 차지하는 면적이 작을수록 얇은 두께나 배터리 용량을 늘릴 수 있는 스마트폰 디자인을 고려한 것이다. ARM CPU 지적 재산을 사용하는 스마트폰의 CPU 코어는 빅리틀 구성으로 6~8개의 코어 탑재가 일반적이다. 또한 높은 그래픽 성능이 요구되고, 모바일 시스템온칩에서 GPU 코어가 차지하는 비율이 늘어나는 추세다. 따라서 CPU 코어는 점점 작아지고 전력 또한 적게 써야 한다. ARM코리아 정성훈 부장은 코어텍스-A73이 이런 장점을 활용해 미드레인지 스마트폰에서도 빅리틀 구현이 가능하다고 말했다. 코어텍스-A73과 A53을 조합하면 싱글스레드 기준으로 성능을 90%까지 향상시킬 수 있다는 것이다.



아키텍처 바뀐 말리-G71

ARM은 최근 GPU 아키텍처를 ‘미드가르드(Midgard)’에서 북유럽 신화에 나오는 신과 인간을 연결하는 무지개다리를 뜻하는 ‘바이프로스트(Bifrost)’로 바꿨다. 주요 포인트는 실행 모델의 변경이다. GPU 실행 모델은 크게 두 종류가 있다. 하나는 ‘Array of Structures(AOS)' 혹은 ‘SIMD(Single Instruction, Multiple Data)’라는 방식이고 다른 하나는 ‘Structure of Arrays(SOA)' 혹은 ‘SIMT(Single Instruction, Multiple Thread)’라는 방식이다. 초기 GPU는 AOS 방식을 채택했으나 엔비디아가 지포스 8800에서 SOA 방식으로 전환하면서 지금은 이 방식을 쓴다. 그런데 지금까지 ARM 홀로 AOS 방식을 고집했었다. 그러다가 이번 말리-G71에서 SOA 방식으로 전환한 것이다. 이 둘은 장단점이 있다. 데이터 유형이 3~4개로 정해져 있는 경우에는 AOS 방식이 효율이 좋다. 그러나 데이터 유형이 다양한 경우 SOA 방식의 대응이 유연하다. 컴파일러 최적화가 용이해 실행 효율을 높여기도 쉽다. 화면 해상도가 높을수록 SOA 방식이 유리한 셈이다. VR의 경우 해상도는 4K, 1초에 120프레임 이상 처리할 수 있어야 어지럼증과 같은 문제가 나타나지 않는다.

ARM은 바이프로스트 아키텍처 전환에 의해 기존 모델(말리-T880)보다 성능은 1.5배, 전력 효을은 20% 이상의 성능을 낸다고 한다. 또 기존 모델이 셰이더 코어를 16개까지 지원했던 반면 말리-G71은 32개까지 구성할 수 있다. 확장성이 훨씬 뛰어난 것이다. 불칸이나 오픈CL 같은 API도 지원한다. 그뿐 아니라 CPU와 GPU가 이용하는 양방향 캐시를 개선, 전체 메모리 대역 효율을 개선하는 것도 잊지 않았다. 말리-G71의 벤치마크 성능 소개에서 ARM코리아 최상익 차장은 랩톱과 비교하며 말리-G71의 소비 전력은 3~4W대에 불과하다. 25W 대의 랩톱의 20% 전력만 이용해 비슷한 성능을 낸다고 강조했다. 가상현실은 4K 해상도에 초당 120프레임 이상을 처리해야 하는 높은 성능만큼 긴 배터리 수명이 요구되기 때문에, ARM의 개선된 전력 효율이 유용하게 쓰일 것으로 예상된다.



모바일로 되돌아온 ARM

ARM의 신제품은 모바일로 회귀했다는 느낌이다. 지난 몇 년 ARM은 모바일보다 서버 같은 고성능 컴퓨팅과 더 작은 사물인터넷 시장에 신경을 썼다. 그러나 코어텍스-A73과 말리-G71은 모바일 기기의 성능 효율 개선에 포커스를 두고 가상현실을 포함한 모바일 플랫폼 확대를 고심하는 눈치였다. 그 배경은 멈출 줄 모르는 모바일 시장의 확대다. ARM코리아 정성훈 부장은 약 30억 대의 ARM 기반 스마트폰이 사용되고 있으며, 올해 안으로 15억 대의 스마트폰이 더 판매될 것이라고 말했다. 스마트폰이 일상생활에서 가장 접근하기 쉬운 컴퓨팅 장치라는 의미다. 또한 앞으로 스마트폰이 사물인터넷과 기계학습, 가상현실 등 새로운 인프라가 자리매김하는데 중요한 역할을 할 것이며 여기에는 빠른 처리 성능과 뛰어난 전력 효율을 가진 모바일 시스템온칩이 필요하다고 덧붙였다. 4K 고해상도에서 120프레임의 높은 프레임 처리 그리고 이 과정에서 지연 시간의 단축은 CPU와 GPU의 밀접한 연계 및 실시간 응답성이 요구되어서다. ARM은 이러한 요구에 부응하기 위해 스마트폰에 최적화된 효율적인 지적재산권을 제공하려는 것이다.

[리뷰전문 유튜브 채널 더기어TV]
이 기사를 공유합니다
ABOUT AUTHOR

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
COMMENT 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.