# AI 경량화 및 최적화

### 소개 &#x20;

* AI 모델의 본격적인 서비스 적용이 가시화됨에 따라 효율적인 Training/Inference에 대한 요구가 증가하고 있지만, 빠르게 발전하는 딥러닝 모델 기술과 달리 컴퓨팅 시스템의 변화는 더딘 편입니다. Efficient AI팀은 날이 다르게 발전하는 CLOVA AI 서비스의 효용성을 높이기 위한 모델 경량화/압축/최적화 기술을 연구/개발합니다. 작은 모델부터 초거대 모델에 이르기까지 다양한 AI 모델을 위한 차별화된 Solution을 연구개발하여 적용합니다. AI 모델 연구개발부터 서비스까지 폭넓은 경험을 하실 수 있습니다.

### 역할  &#x20;

* HyperScale AI 모델을 위한 효율적인 Training/Inference 알고리즘 연구 및 개발
* 딥러닝 모델 경량화/압축 기술 연구 및 개발
* 효율적인 인퍼런스를 위한 CPU/GPU 커널 개발&#x20;
* AI 모델 기반 서비스 비용 최적화&#x20;

### 자격요건

* Vision/Speech/NLP 딥러닝 모델에 대한 이해 및 학습 경험.
* Pruning, Quantization, Knowledge Distillation, Low-rank Approximation, Low-precision Format 등의 기술을 딥러닝 모델에 적용해본 경험.
* 특정 Inference system에 맞게 Converting, Deployment 및 Optimization 경험.
* Computing System에 대한 이해 (CPU, GPU, NPU, Accelerators, .. )

### 우대사항  &#x20;

* 딥러닝 분야, 시스템 소프트웨어 분야, 하드웨어 분야 논문 작성 경험 / Publication 실적.
* 딥러닝 서비스 개발/배포/최적화 경력.
* 시스템 소프트웨어 개발 경험&#x20;
* CUDA Programming 및 low-level 딥러닝 프레임워크 개발 경험.
* FPGA/ASIC 등 하드웨어 설계 지식 보유.
