지식베이스
Knowledge Base
Last updated
Knowledge Base
Last updated
Knowledge Base는 빅데이터를 수집하고 네이버의 검색 결과 중 방송, 음악, 날씨, 스포츠 등 사용자의 생활과 밀접한 정보를 노출시켜 주는 조직입니다. 데이터 제공처로부터 나오는 다양한 주제별 데이터가 네이버 검색결과 화면에 나오는 과정은 모두 이 곳에서 이루어지고 있습니다. 또한 단순 검색으로 찾을 수 없는 신뢰도 높은 결과를 사용자에게 제공하기 위한 연구와 개발을 진행하고 있습니다.
각종의 API, DB 들로 부터 "데이터"를 수집하고, 이를 지식그래프 형태로 가공하고 모델링을 통해 "정보"를 만들어내고, 이 정보를 사용자가 소비하기 용이한 형태의 "지식"의 형태로 서비스하는 것이 우리의 일입니다. 이러한 역할을 맡으면 데이터 처리 및 가공, 데이터 시각화, 모델링을 경험할 수 있으며 전반적인 데이터의 흐름을 느낄 수 있는 환경 속에서 전문가로 거듭날 수 있습니다.
사용자들이 원하는 컨텐츠를 직접 가독성 높은 화면으로 제공해주는 컨텐츠 검색 뿐만아니라 네이버가 보유하고 있는 방대한 데이터를 사전으로 제공해 주는 서비스인 지식백과를 운영하고 있습니다. 또한 영화 정보와 사용자 리뷰 데이터를 다루는 영화, 책, 자동차, 인물과 같이 독립적으로 데이터를 정리하여 보여주는 서비스도 운영하고 그 분야를 넓혀가고 있습니다. 운영되는 서비스들 모두 대용량 트래픽을 처리하는 서비스들이기에, 많은 사용자에게 다양한 정보를 어떻게 장애 없이 서비스 할 것인가도 우리의 고민거리 중 하나입니다.
지식백과, 컨텐츠 검색 모두 다루는 데이터의 종류가 다른 만큼 제공처의 환경, 데이터의 형태가 다양합니다. 이러한 조건 속에서 데이터의 수집 속도와 정합성을 높이는 일이 중요합니다. 데이터를 수집하는 수많은 배치 작업이 멈추지 않고 동작하기 위해 빅데이터 클러스터, 서버리스 플랫폼 등을 적극적으로 활용하고 있습니다. 각각 데이터에 가장 적합한 형태의 DB를 구성하고, DB를 효율적으로 조회, 정제할 수 있는 환경을 운영, 구축하는 작업을 진행하고 있습니다.
검색어에 따라 방송 목록을 보고 싶은 경우, 영화배우의 정보를 보고 싶은 경우, 코로나 확진자의 증감율 표를 보고 싶은 경우가 있습니다. 사용자가 원하는 대로 데이터를 가공하여 가독성 높은 템플릿에 정보를 제공해 줍니다. 다양한 형태로 수집된 데이터를 가독성이 높은 템플릿으로 보여주기 위해, 적합한 데이터 형태로 가공하는 작업을 진행합니다. 적절한 모델로 데이터를 분석하고, 적합한 형태로 가공해 데이터와 데이터를 연결하여 다채로운 데이터를 탄생시키는 Knowledge Graph 기술이 사용됩니다.
분석하고 가공된 Knowledge Graph를 기반으로 사용자들에게 가독성 높은 페이지를 제공합니다. Knowledge Graph를 이용하여 복잡하고 다양한 컨텐츠 간의 관계를 분석한 뒤 주제에 맞는 또 다른 컨텐츠를 사용자들에게 추천해주어 사용자가 좀 더 많은 정보를 접할 수 있게 합니다. 이런 과정에서, 사용자의 니즈를 다시 또 파악하여, 새로운 데이터를 수집, 분석, 가공하여, 더 높은 품질의 검색 결과를 제공하게 됩니다. 사용자가 만족할만한 신뢰도 높은 정보를 검색결과로 제공하는 만큼 남다른 보람을 느낄 수 있습니다.
지식베이스는 국내 뿐만 아니라 글로벌 환경에서도 서비스 및 연구를 하고 있습니다. 특히 일본 라인 지식베이스의 검색 서버를 개발/운영하는 역할을 수행하며, 세계적인 검색 서비스 개발의 기회가 열려 있습니다. 글로벌 데이터에 해당하는 날씨, 인물, 영화, 방송 등의 검색 컬렉션을 서비스하고 있으며 분야를 넓혀가고 있습니다.
아래와 같이 함께 일할 수 있는 동료를 모십니다.