AI 경량화 및 최적화
모델 경량화/압축/최적화 기술 연구 및 개발
소개
AI 모델의 본격적인 서비스 적용이 가시화됨에 따라 효율적인 Training/Inference에 대한 요구가 증가하고 있지만, 빠르게 발전하는 딥러닝 모델 기술과 달리 컴퓨팅 시스템의 변화는 더딘 편입니다. Efficient AI팀은 날이 다르게 발전하는 CLOVA AI 서비스의 효용성을 높이기 위한 모델 경량화/압축/최적화 기술을 연구/개발합니다. 작은 모델부터 초거대 모델에 이르기까지 다양한 AI 모델을 위한 차별화된 Solution을 연구개발하여 적용합니다. AI 모델 연구개발부터 서비스까지 폭넓은 경험을 하실 수 있습니다.
역할
HyperScale AI 모델을 위한 효율적인 Training/Inference 알고리즘 연구 및 개발
딥러닝 모델 경량화/압축 기술 연구 및 개발
효율적인 인퍼런스를 위한 CPU/GPU 커널 개발
AI 모델 기반 서비스 비용 최적화
자격요건
Vision/Speech/NLP 딥러닝 모델에 대한 이해 및 학습 경험.
Pruning, Quantization, Knowledge Distillation, Low-rank Approximation, Low-precision Format 등의 기술을 딥러닝 모델에 적용해본 경험.
특정 Inference system에 맞게 Converting, Deployment 및 Optimization 경험.
Computing System에 대한 이해 (CPU, GPU, NPU, Accelerators, .. )
우대사항
딥러닝 분야, 시스템 소프트웨어 분야, 하드웨어 분야 논문 작성 경험 / Publication 실적.
딥러닝 서비스 개발/배포/최적화 경력.
시스템 소프트웨어 개발 경험
CUDA Programming 및 low-level 딥러닝 프레임워크 개발 경험.
FPGA/ASIC 등 하드웨어 설계 지식 보유.
Last updated