
인공지능(AI) 시대 필수 인프라로 떠오른 그래픽처리장치(GPU)를 효율적으로 활용할 수 있도록 지원하는 모니터링 솔루션이 주목받고 있다. GPU가 고가의 장비지만, 비교적 수명이 짧고 고장이 많기 때문에 인프라 관리 감독의 필요성이 커지고 있는 추세다. 이런 가운데 GPU 도입 수요가 높은 국내 대기업과 공공 시장을 적극 공략할 방침이다.
17일 이동인 와탭랩스 대표는 서울 강남구 와탭랩스 사무실에서 열린 '옵저버빌리티 미디어 데이'에서 차세대 운영 플랫폼 '와탭 GPU 모니터링' 솔루션 출시를 알리면서 이같이 밝혔다.
올해로 10년차를 맞은 와탭랩스는 국내 1세대 서비스형소프트웨어(SaaS) 기업으로, 현재 국내외 1만2000개 이상 기업에 퍼블릭 SaaS를 제공하고 있다. 일본, 인도네시아, 말레이시아, 태국 등 동아시아 지역을 진출하고 있으며, 국내 SaaS 기업으로선 해외지역에서 의미있는 성과를 내고 있다고 평가받는다.
이동인 와탭랩스 대표는 "GPU는 단순한 컴퓨팅 리소스를 넘어 이제는 기업 경쟁력의 기반이 되는 전략적 자산이지만, 많은 기업들이 여전히 GPU 상태를 제대로 관측하지 못해 큰 손실을 겪고 있다"면서 "AI 서비스를 구현하는 데 GPU를 100%로 활용할 수 있도록 지원하는 솔루션이 필요하고, 와탭랩스는 전체 인프라 안에서 GPU까지 통합 관측이 가능한 환경을 구축했다"고 밝혔다.
회사가 선보인 '와탭 GPU 모니터링'은 GPU 활용률, 메모리 사용량, 온도, 전력 소비 등 주요 지표를 통합적으로 관측해 자원 낭비 없이 최적화된 운영을 가능하게 하는 솔루션이다. 쿠버네티스 기반의 복잡한 환경에서도 실시간 모니터링, 경고 알림, 장기적 분석 기능을 제공한다. SaaS와 온프레미스를 아우르는 하이브리드 환경에서도 안정적으로 작동한다.
특히 GPU는 고가 자산 대비 짧은 수명과 장애에 취약해 관리감독이 필수적이다. 최진식 와탭랩스 개발 총괄은 "분산도가 높은 AI 인프라 환경에서는 서비스 장애 발생 시 영향 범위가 기하급수적으로 커지고, GPU 수명도 일반적으로 1-3년으로 짧기 때문에 자원을 얼마나 효율적으로 활용하느냐가 중요한 과제"라며 "고가의 GPU 자원을 낭비 없이 효율적으로 운영할 수 있도록 지원하는 데 중점을 두고 개발했다"고 설명했다.
또한 GPU 자원을 통합적으로 관리할 수 있다는 게 장점이다. 단순 사용률 수치 기반의 모니터링을 넘어, GPU부터 파드(Pod), 애플리케이션까지 연결된 종합적인 인사이트를 제공한다. 현재는 엔비디아 GPU 중심으로 제공 중이나, 향후 AMD 등 다양한 GPU를 모니터링할 수 있도록 확대할 방침이다. 최 총괄은 "GPU 모니터링 솔루션이 아직 국내에선 생소하지만, 쿠버네티스 환경에서 AI 워크로드를 실행하는 데 GPU 활용률을 가시적으로 확인할 수 있어서 기업 고객들의 피드백이 좋은 편"이라고 밝혔다.
GPU를 대거 도입 중인 공공과 대기업을 중심으로 공략할 예정이다. 이 대표는 "국내에서 민간과 공공을 합쳐 올해 2조원 이상의 GPU 인프라를 도입할 계획인데, 1년 동안 국내 전체에서 사용하는 인프라 비용이 4조원인 것과 비교하면 상당히 큰 규모"라면서 "국내 대부분 대기업들이 GPU를 구매하고 있는데, 현재 이들 기업과 기술검증(PoC)을 여러개 진행 중"이라고 밝혔다. 최 총괄 역시 "공공에서도 GPU 모니터링 수요가 커지고 있으며, SaaS·프라이빗 SaaS·온프레미스 등 다양한 환경에서 PoC를 진행하거나 도입한 곳도 있다"고 말했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지