가비아, 리벨리온 NPU 구독 서비스 출시

  • GPU 대안 부상… 비용·전력 효율 앞세운 NPU 인프라 확대

  • LLM·실시간 분석 겨냥

가비아가 국산 NPU 기반으로 한 NPUaaS를 출시했다사진가비아
가비아가 국산 NPU 기반으로 한 NPUaaS를 출시했다.[사진=가비아]

클라우드 전문 기업 가비아가 국내 인공지능(AI) 반도체 기업 리벨리온의 신경망처리장치(NPU) '아톰-맥스' 기반 클라우드 서비스를 9일 출시했다. 

최근 엔비디아 그래픽처리장치(GPU) 수급 불안과 비용 부담이 커지면서, 국내 AI 반도체 기반 추론 인프라에 대한 수요가 확대되는 추세다.

NPUaaS는 NPU 인프라를 클라우드 방식으로 구독해 사용하는 서비스다. NPU는 학습된 AI 모델을 실제 서비스에 적용하는 추론 작업에 특화된 반도체로, GPU 대비 전력 소모가 적고 비용 효율이 높아 GPU 의존도를 낮추려는 기업의 대안으로 주목받고 있다.

인스턴스(VM) 기반으로 출시된 가비아의 NPUaaS는 운영체제(OS) 커널 수준의 세밀한 환경 설정과 개인화가 가능하다. 정밀한 인프라 구성을 지원하며, 서비스 목적에 따라 유연하게 확장할 수 있다는 점도 특징이다. 

가비아의 NPUaaS는 특정 AI 워크로드에 맞춰 인프라 환경을 정밀하게 제어해야 하는 기업을 주요 고객으로 한다. 대규모 거대언어모델(LLM) 서빙 등 고성능 추론 환경의 세밀한 튜닝이 요구되는 워크로드, 저지연이 요구되는 실시간 영상·음성 분석, 보안 정책상 커널 수준의 격리가 필요한 금융·의료·공공 분야 등에 특히 적합하다.

서비스 출시에 맞춰 가비아는 도입을 검토 중인 기업을 대상으로 'AI 추론 프레임워크 최적화 컨설팅'을 함께 제공한다. AI 모델을 개발하고도 서빙 환경 구축 단계에서 어려움을 겪는 기업이 적지 않기 때문이다. 

고객사 워크로드 특성에 따른 맞춤형 기술 지원도 병행한다. 

정대원 가비아 상무는 "AI 서비스의 경쟁력은 모델 성능만큼이나 추론 환경의 효율성에 달려 있다"며 "NPUaaS와 전문 컨설팅을 결합해 기업이 인프라 부담 없이 AI 비즈니스에 집중할 수 있는 환경을 만들겠다"고 말했다.
 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기