고효율 고성능 색인-검색 컴포넌트 개발
검색 대상의 규모가 방대해질수록 사용자가 원하는 문서를 정확히 찾아내기가 점점 어려집니다. 이 문제를 풀기 위해 ML 기술을 이용한 다양한 검색 랭킹 기법이 시도 되고 있습니다. 새로운 랭킹 기법들은 더 많은 계산량을 요구하며, 더 큰 색인 데이터를 필요로 합니다. Demanding한 환경에서도 검색 엔진을 고효율, 고성능으로 유지하고 개선하는 것은 매우 중요한 일입니다.
- 검색 엔진의 핵심이라고 할 수 있는 역색인을 비롯한 자료 구조를 개선하고, 새로운 검색 패러다임을 위한 신규 저장 구조를 설계, 구현합니다. 
- 사용자 질의로부터 최소한의 비용으로 최적의 결과를 얻는 성능 엔지니어링을 수행합니다. 
- AI 기반의 최신 랭킹 알고리즘(ANN, Bert)을 수행하기 위한 색인 및 질의 처리 구조를 연구합니다. 
함께 하고 싶어요
이런 분을 모십니다
다음은 필수
- 리눅스 환경에서 개발이 친숙하신 분(g++, sh, cmake, git 등 개발 도구에 익숙해야 함) 
- C++ 로 규모 있는 프로젝트(수만 라인 이상) 참여 가능하신 분 (C++ 의 여러 함정을 피할 수 있는 경험이 있고 클린 코드를 작성, 설계 할 수 있어야 함.) 
- 유닛 테스트를 생명같이 여기시는 분 (googletest 가 뭔지 알아야 함) 
- 문서화 및 기술 공유를 잘 하시는 분 (복잡한 기술 업무 내용을 잘 전달하고 설명할 수 있어야 함) 
다음 중 하나 이상 해당
- 압축 기법 등 자료 구조 최적화 업무 경험 
- 데이터베이스 시스템 질의 최적화 개발 경험 
- LLVM 등 컴파일러 개발 경험 
이런 분이면 더 좋아요
- 정보 검색 이론(Information Retrieval) 관련 지식 
- 벡터 유사도 검색(ANN) 관련 깊은 지식 
- 리눅스 커널의 메모리, 입출력, 스케쥴링 관련 깊은 지식 
- 오픈 소스 프로젝트 기여 
Last updated
