대용량 분산 검색 엔진 개발
Last updated
Last updated
네이버 검색 엔진은 초록 검색창에 입력한 질의로부터 즉시 최적의 문서를 찾는 검색 서비스의 심장입니다. 네이버 검색 시스템에는 매초 수천 개가 넘는 질의가 쏟아져 들어오며, 문서 수십억 개가 넘는 방대한 자료에서 사용자가 원하는 결과를 순식간에 찾아야 합니다. 효율적인 색인과 질의 처리, 확장성 높은 분산 처리 구조를 직접 설계하고 개발하기란 어느 회사에서도 해보기 어려운 도전적인 일로서, 프로그래머로서 최고의 성취감을 느낄 수 있습니다.
우리는 글로벌 문서들까지 검색 대상으로 서비스를 대규모로 확장하고 있습니다. 규모 확장에 효과적으로 대비하기 위해 검색 엔진이 더 높은 성능을 발휘할 수 있도록 개선하고, 더 많은 문서에서도 더 정확한 검색 결과를 찾기 위해 고급 랭킹 기능을 개발하고 있습니다. 서버 자원을 최대로 활용하고 높은 안정성을 갖춘 분산 색인과 분산 검색 아키텍처를 설계하고, 수천대 규모와 복잡도의 서버들을 효율적으로 운영하기 위한 엔진 운영 도구를 개발하고 있습니다.
DEVIEW 2021 300 억 벡터를 서빙하라! 네이버 검색은 ColBERT 벡터 유사도 검색 도전 중
2021 NAVER Search Colloquium : Search Engine and SRE Platform for Global Web Search System
DEVIEW 2020 C++로 다시 쓴 ES, Ultimate Search