Search SRE
저희는 크게 '대용량 시계열 데이터 시스템 개발', '대용량 검색 서비스 지표 수집 시스템 개발', '검색 서비스 장애 능동 대응 시스템 개발', '동영상/이미지/블로그/지식인 검색 시스템 DevOps' 업무를 진행하고 있습니다. 자세한 내용은 아래 참고 부탁드립니다.
대용량 시계열 데이터 시스템 개발
국내 어디에서도 경험할 수 없는 최대 규모의 서비스인 네이버 검색의 시계열 데이터 시스템을 개발합니다. 빠르게 성장하는 네이버 검색에서 각종 시스템 지표와 데이터를 수집하고, 저장하고, 처리하는 시스템을 함께 만들어 갈 동료를 찾고 있습니다. 아래와 같은 경험을 함께 하실 수 있습니다.
초대용량 시계열 데이터 처리 : 글로벌 스케일의 시계열 데이터 처리
초스피드/고해상도 이상 탐지 : 시스템에서 어떤 일이 일어나고 있는지 빠르고 정확하게 판단하고 경보해주는 시스템 구축
지능형 비상 대응 : 비상 상황 발생 시 대응을 자동화하여 사용자 영향을 최소화하는 시스템 개발
대용량 검색 서비스 지표 수집 시스템 개발
저희가 하는 것은 기존 지표수집 및 모니터링 시스템에 도전하면서, 매일 새롭고 효율적인 방법에 대해 고민합니다.
검색 모니터링 시스템은 지난 20여년 간 서비스의 변화에 발맞추어 꾸준히 진화하고 발전하고 있습니다. 1세대 모니터링 시스템부터 2세대, 3세대 및 앞으로 만들어질 차차세대 모니터링 시스템까지 "점점 더 복잡도 높은 플랫폼", "점점 더 다양화되는 서비스", "국내 플랫폼에서 안주하지 않는 글로벌 플랫폼"을 위한 새로운 아키텍쳐를 고민하면서 기술 발전과 패러다임의 변화에 대응하며 검색플랫폼시스템/서비스을 더욱 안정적으로 지탱할 수 있도록 만들고자 합니다.
저희는 글로벌 검색 플랫폼 시스템/서비스를 안정적으로 지탱하기 위한 글로벌 스케일 모니터링 시스템을 만들고 있습니다.
이런 글로벌 최고의 지표수집 & 모니터링 시스템 개발에 함께 손에 흙을 묻히고, 발자취를 남기며 성장하고자 하는 분을 모시고 있습니다. 저희와 함께 쉽지 않겠지만, 도전적인 여정을 떠나고자 하신다면 주저없이 연락주십시오.
검색 서비스 장애 능동 대응 시스템 개발
국내 최고의 검색 시스템 안정화를 위해 멋진 시스템을 만들어나갈 동료를 찾습니다. 안정적인 네이버 검색 서비스를 제공하기 위한 다양한 기술 개발 및 시스템 운영을 어떻게 하고 있는지 궁금하지 않으십니까?
IT에 몸담고 있으신 분이라면 장애의 경험과 고통이 있으실 겁니다. 불이 나면 더 큰불로 번지지 않도록 맞불을 놓듯이, 장애 발생 시 장애가 심각한 상황으로 빠지기 전에 선제적, 능동적 대응을 할 수 있는 자동화 시스템을 개발합니다.
이런 새로운 시스템의 연구/개발을 함께하고자 하시는 분 계시다면 저희와 함께 여정을 떠나보시는 건 어떠십니까?
동영상/이미지/블로그/지식인 검색시스템 DevOps
국내 최고의 검색 시스템 전문가들과 함께 할 경력 개발자분들을 기다리고 있습니다. 국내 어디에서도 경험할 수 없는 대용량 검색 DevOps 업무를 하실 수 있으며, 수천대로 구성된 시스템을 개발하고 운영하면서 국내 최고의 DevOps 전문가가 되실 수 있습니다.
이런 일을 하고 있습니다
검색 장애율 0%대 ‘철통방어선’은 바로 이곳 : https://n.news.naver.com/article/138/0002102957
네이버가 검색 서비스 장애율을 0%대로 낮춘 비결 : https://n.news.naver.com/article/092/0002207016
[네이버 어벤저스] SSR에서 개발자 시야를 넓혀보세요 : https://n.news.naver.com/article/138/0002075014
[네이버 어벤저스] 대한민국의 관심사요? SSR이 압니다 : https://n.news.naver.com/article/138/0002074732
검색 콜로키움 2022 : Super Fast SRE & Automated Outage Recovery
검색 콜로키움 2021 : Search Engine and SRE Platform for Global Web Search System
NAVER D2 : 네이버 검색의 SRE 시스템
DEVIEW 2020 : A hands-on SRE (손에 잡히는 SRE)
DEVIEW 2019 : Fail Fast, Learn Faster SRE (실패에서 배워나가는 SRE)
DEVIEW 2018 : Search Reliability Engineering
함께 할 분을 모십니다
대용량 시계열 데이터 시스템 개발
입사하게 되면 담당할 업무입니다.
시계열 데이터 수집 파이프라인 구축, 운영
이상 탐지 알고리즘 및 시스템 개발
서비스와 시스템을 관통하는 Insight를 얻기 위한 데이터 분석 및 시각화
업무를 수행하기 위해 필요한 자격 요건입니다.
python, java(kotlin), javascript(typescript) 중 한 가지 이상의 언어를 익숙하게 사용하시는 분
유지 보수하기 편하고 확장에 열려있는 시스템에 대해서 고민해 보신 분
시스템을 안정적으로 유지하기 위해서 자동화에 힘써보신 분
추가로 보유하고 있다면 좋을 스킬 셋이나 경험입니다.
지금까지의 개발, 운영 경험을 바탕으로 흥미진진한 이야기를 들려주실 수 있는 분
분산 시스템에서의 성능 분석과 최적화에 자신 있는 분
복잡하고 거대한 데이터에서 핵심 정보를 찾아내는 일을 즐기시는 분
다음 중 하나 이상의 기술에 익숙하신 분 : Kubernetes, Kafka, Grafana, Spring, Next.js, Nest.js, Prisma2, Prometheus, VictoriaMetrics
Last updated