# AI 경량화 및 최적화

### 소개 &#x20;

* AI 모델의 본격적인 서비스 적용이 가시화됨에 따라 효율적인 Training/Inference에 대한 요구가 증가하고 있지만, 빠르게 발전하는 딥러닝 모델 기술과 달리 컴퓨팅 시스템의 변화는 더딘 편입니다. Efficient AI팀은 날이 다르게 발전하는 CLOVA AI 서비스의 효용성을 높이기 위한 모델 경량화/압축/최적화 기술을 연구/개발합니다. 작은 모델부터 초거대 모델에 이르기까지 다양한 AI 모델을 위한 차별화된 Solution을 연구개발하여 적용합니다. AI 모델 연구개발부터 서비스까지 폭넓은 경험을 하실 수 있습니다.

### 역할  &#x20;

* HyperScale AI 모델을 위한 효율적인 Training/Inference 알고리즘 연구 및 개발
* 딥러닝 모델 경량화/압축 기술 연구 및 개발
* 효율적인 인퍼런스를 위한 CPU/GPU 커널 개발&#x20;
* AI 모델 기반 서비스 비용 최적화&#x20;

### 자격요건

* Vision/Speech/NLP 딥러닝 모델에 대한 이해 및 학습 경험.
* Pruning, Quantization, Knowledge Distillation, Low-rank Approximation, Low-precision Format 등의 기술을 딥러닝 모델에 적용해본 경험.
* 특정 Inference system에 맞게 Converting, Deployment 및 Optimization 경험.
* Computing System에 대한 이해 (CPU, GPU, NPU, Accelerators, .. )

### 우대사항  &#x20;

* 딥러닝 분야, 시스템 소프트웨어 분야, 하드웨어 분야 논문 작성 경험 / Publication 실적.
* 딥러닝 서비스 개발/배포/최적화 경력.
* 시스템 소프트웨어 개발 경험&#x20;
* CUDA Programming 및 low-level 딥러닝 프레임워크 개발 경험.
* FPGA/ASIC 등 하드웨어 설계 지식 보유.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://naver-career.gitbook.io/kr/service/clova/ai.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
