고효율 고성능 색인-검색 컴포넌트 개발
검색 대상의 규모가 방대해질수록 사용자가 원하는 문서를 정확히 찾아내기가 점점 어려집니다. 이 문제를 풀기 위해 ML 기술을 이용한 다양한 검색 랭킹 기법이 시도 되고 있습니다. 새로운 랭킹 기법들은 더 많은 계산량을 요구하며, 더 큰 색인 데이터를 필요로 합니다. Demanding한 환경에서도 검색 엔진을 고효율, 고성능으로 유지하고 개선하는 것은 매우 중요한 일입니다.
검색 엔진의 핵심이라고 할 수 있는 역색인을 비롯한 자료 구조를 개선하고, 새로운 검색 패러다임을 위한 신규 저장 구조를 설계, 구현합니다.
사용자 질의로부터 최소한의 비용으로 최적의 결과를 얻는 성능 엔지니어링을 수행합니다.
AI 기반의 최신 랭킹 알고리즘(ANN, Bert)을 수행하기 위한 색인 및 질의 처리 구조를 연구합니다.
함께 하고 싶어요
이런 분을 모십니다
다음은 필수
리눅스 환경에서 개발이 친숙하신 분(g++, sh, cmake, git 등 개발 도구에 익숙해야 함)
C++ 로 규모 있는 프로젝트(수만 라인 이상) 참여 가능하신 분 (C++ 의 여러 함정을 피할 수 있는 경험이 있고 클린 코드를 작성, 설계 할 수 있어야 함.)
유닛 테스트를 생명같이 여기시는 분 (googletest 가 뭔지 알아야 함)
문서화 및 기술 공유를 잘 하시는 분 (복잡한 기술 업무 내용을 잘 전달하고 설명할 수 있어야 함)
다음 중 하나 이상 해당
압축 기법 등 자료 구조 최적화 업무 경험
데이터베이스 시스템 질의 최적화 개발 경험
LLVM 등 컴파일러 개발 경험
이런 분이면 더 좋아요
정보 검색 이론(Information Retrieval) 관련 지식
벡터 유사도 검색(ANN) 관련 깊은 지식
리눅스 커널의 메모리, 입출력, 스케쥴링 관련 깊은 지식
오픈 소스 프로젝트 기여
Last updated