고효율 고성능 색인-검색 컴포넌트 개발

검색 대상의 규모가 방대해질수록 사용자가 원하는 문서를 정확히 찾아내기가 점점 어려집니다. 이 문제를 풀기 위해 ML 기술을 이용한 다양한 검색 랭킹 기법이 시도 되고 있습니다. 새로운 랭킹 기법들은 더 많은 계산량을 요구하며, 더 큰 색인 데이터를 필요로 합니다. Demanding한 환경에서도 검색 엔진을 고효율, 고성능으로 유지하고 개선하는 것은 매우 중요한 일입니다.

  • 검색 엔진의 핵심이라고 할 수 있는 역색인을 비롯한 자료 구조를 개선하고, 새로운 검색 패러다임을 위한 신규 저장 구조를 설계, 구현합니다.

  • 사용자 질의로부터 최소한의 비용으로 최적의 결과를 얻는 성능 엔지니어링을 수행합니다.

  • AI 기반의 최신 랭킹 알고리즘(ANN, Bert)을 수행하기 위한 색인 및 질의 처리 구조를 연구합니다.

함께 하고 싶어요

이런 분을 모십니다

다음은 필수

  • 리눅스 환경에서 개발이 친숙하신 분(g++, sh, cmake, git 등 개발 도구에 익숙해야 함)

  • C++ 로 규모 있는 프로젝트(수만 라인 이상) 참여 가능하신 분 (C++ 의 여러 함정을 피할 수 있는 경험이 있고 클린 코드를 작성, 설계 할 수 있어야 함.)

  • 유닛 테스트를 생명같이 여기시는 분 (googletest 가 뭔지 알아야 함)

  • 문서화 및 기술 공유를 잘 하시는 분 (복잡한 기술 업무 내용을 잘 전달하고 설명할 수 있어야 함)

다음 중 하나 이상 해당

  • 압축 기법 등 자료 구조 최적화 업무 경험

  • 데이터베이스 시스템 질의 최적화 개발 경험

  • LLVM 등 컴파일러 개발 경험

이런 분이면 더 좋아요

  • 정보 검색 이론(Information Retrieval) 관련 지식

  • 벡터 유사도 검색(ANN) 관련 깊은 지식

  • 리눅스 커널의 메모리, 입출력, 스케쥴링 관련 깊은 지식

  • 오픈 소스 프로젝트 기여

Last updated