기술 직무 안내
  • Readme
  • NAVER Tech Career (Eng)
  • 서비스 소개
    • 검색, 추천 서비스
      • NLP
        • 텍스트 분석 기술
        • 언어 모델
        • Question Answering 기술
      • Data&Analytics
      • 인텐트 검색
      • 웹검색
      • Vision
      • 지식스니펫
      • 쇼핑검색&추천
        • Product Search & Ranking
        • Product Recommendation (AiTEMS)
        • Catalog Matching & Enrichment
      • AiRSearch
        • 글로벌 추천 모델링(AI/ML)
        • 통합 개인화 플랫폼(BE/DE)
        • 통합 검색 모델링(AI/ML)
      • AI Data Platform
      • 지식베이스
      • 클라우드검색솔루션 프로젝트
      • Server Platform
      • Engine & Solution
        • 대용량 분산 검색 엔진 개발
          • 고효율 고성능 색인-검색 컴포넌트 개발
          • 검색 엔진 분산 아키텍쳐 개발
          • 대규모 검색 클러스터 운영 도구 개발
        • 고성능 서버리스 플랫폼 개발
      • 지역검색&추천
        • Local Search
        • AirSPACE
      • 신뢰성 플랫폼
        • Search FE
        • Search Portal
        • Search SRE
    • 공통 플랫폼 기술 개발
      • Next 페이 프로젝트 서버 개발
    • 광고 플랫폼, 여행 검색 외
      • Front-end
      • Back-end
      • AI/ML
      • Data
      • Android
      • iOS
    • 네이버 쇼핑
      • 스마트스토어
      • 버티컬쇼핑서비스
      • 쇼핑검색서비스
      • 라이브커머스
    • 뉴스, 연예, 스포츠 외
      • Back-end
      • ML/Data engineering
    • 블로그, 지식iN/eXpert 외
      • iOS
      • Android
      • Front-end
      • Back-end
      • Data
    • 회원&인증플랫폼
      • iOS
      • Android
      • Back-end
      • Front-end
      • Data
    • 🧑‍🚀Community CIC
      • Global Community Dev FrontEnd
      • Global Community Dev BackEnd
      • Open Community Dev FrontEnd
      • Open Community Dev BackEnd
      • Android
      • iOS
      • Business Data
      • Service Data
      • Core Backend
      • Naver Game Server Dev
      • Naver Game Client Dev
    • 밴드 Cell
      • 밴드 Cell Web
    • NAVER CLOUD AI
      • NAVER AI LAB
      • 음성인식 (Speech Recognition)
      • 음성합성 및 Avatar 생성 기술 연구
      • 클로바 Vision/NLP 연구 개발
      • CLOVA Vision Kit
        • Face AI
        • Video AI
        • Avatar AI
        • Edge AI
        • Edge Solution AI
        • Data Engineer
      • 초대규모 멀티모달 & 시계열 & 쇼핑 모델링 기술 연구개발
      • CLOVA 언어 모델 연구 및 대화 시스템 개발
      • HCI X AI
      • AI 경량화 및 최적화
      • ML 연구 플랫폼 NSML 개발
      • AI/ML 서비스 & 플랫폼 개발
      • AutoML을 이용한 모델 자동 훈련 시스템 개발
      • HyperCLOVA Engineering
      • Document Intelligence
      • 머신러닝을 위한 대규모 데이터 플랫폼 구축
      • 초대규모 AI 모델 학습 / 서빙 시스템 구축 및 운영
      • DATA AI
      • AI Assistant 대화/검색시스템 연구 개발
      • CLOVA Note
        • CLOVA Note App (iOS)
    • ETECH
      • Front-end
      • Back-end
      • Android
      • iOS
      • Data
      • Graphics
    • Maps
      • iOS
      • Android
      • Back-End
    • Music
      • Music iOS
      • Music Android
      • Music Server
      • Music Platform
        • META STORE
        • OPEN-API
        • PARTY ROOM
        • NAVER SEARCH
        • DATA
      • Music AI
      • Music Quality Engineering
      • LINE MUSIC iOS
      • LINE MUSIC Android
      • LINE MUSIC Server
    • Papago
      • Front-end
      • Back-end
      • AI/ML
      • Android
      • iOS
    • PLACE
      • iOS
    • Whale
      • Browser
      • Web Engine
      • Whale OS
      • Front-end
      • Back-end
      • Whale Android
      • Whale iOS
    • Security
      • Service Security
      • Security Development
    • 네이버앱플랫폼Tech
      • Naver App
        • Android
        • iOS
      • PWE앱
        • Android
        • iOS
      • 스마트보드앱
    • WORKS MOBILE
      • iOS
      • Android
  • SmartStudio
    • Front-end
    • Back-end
    • Android
    • iOS
Powered by GitBook
On this page
  • ML/AI 기반 상품 분석
  • 대규모 분산 클러스터링 (Billion-scale Clustering for Shopping Items)
  • 채용분야
  1. 서비스 소개
  2. 검색, 추천 서비스
  3. 쇼핑검색&추천

Catalog Matching & Enrichment

PreviousProduct Recommendation (AiTEMS)NextAiRSearch

Last updated 3 years ago

Catalog Matching & Enrichment 에서는 네이버, 라인, 글로벌 쇼핑 검색 상품을 분석하기 위한 AI 기술 연구와 대규모 분산 처리 클러스터링 플랫폼을 개발하고 있습니다.

상품의 이름과 설명, 그 외의 다양한 속성으로 구성된 텍스트와 이미지로부터 중요 정보를 추출하고 추출된 정보들을 토대로 유사 상품간의 연관성을 분석하여 클러스터링 하는 것이 주요 업무입니다.

많은 연산량을 필요로 하는 머신러닝/AI 기술을 더욱 확장하기 위해 모델 자체의 개선 뿐만 아니라, 대규모 데이터 처리 플랫폼의 성능을 최대로 끌어내는 백엔드 기술 개발을 병행하고 있습니다.

현재는 동일 상품을 넘어, 유사 상품 간의 속성 별 세부 비교가 가능한 클러스터링을 위해 연구를 확장하고 있습니다.

ML/AI 기반 상품 분석

상품의 정보를 분석하고 고유의 속성과 특징을 추출하기 위해 ML/AI 기술을 사용하고 있습니다. 매일 새롭게 등록되고 있는 수 많은 상품 제목에 포함 된 상품의 이름이나 모델 번호, 브랜드 정보 들을 분석합니다.

'개수', '용량' 등 상품의 가격에 영향을 미치는 구매 조건 정보를 추출하여 부족한 정보를 보완하기도 합니다.

더 정확하고 높은 품질의 클러스터링을 위해 상품 이미지 분석 기술이 사용되고 있습니다. 이미지 해시 추출, 지역 특징 분석 및 매칭, 그리고 Deep learning을 활용한 임베딩 기법 등이 있습니다.

최근에는 이미지 분석 기술을 확장하여, 상품에 부족한 정보를 '추론'하여 생성하는 기술에 힘을 쏟고 있습니다.

대규모 분산 클러스터링 (Billion-scale Clustering for Shopping Items)

상품에서 추출된 정보들은 대규모 분산 시스템을 통해 클러스터링 작업을 거치게 됩니다. 수십억 건 이상의 상품을 다루고 있는 분산 클러스터링 시스템은 백엔드 시스템의 핵심 기술입니다.

채용분야

  • Machine learning / Deep learning / Data mining

  • Computer vision / Image processing / Object recognition / Deep tagging

  • Information retrieval / extraction / classification

  • Natural language Processing / Query understanding

  • Distributed computing / Large-scale system design / Large-scale data processing

문의:

seungkwon.choe@navercorp.com
자동 상품 가격 비교 페이지 예시
Multilingual Universal Sentence Encoder 예시
구매 조건 추출 예시
Catalog Matcing & Enrichment에서 사용되고 있는 ML/AI 기반 이미지 분석 기술
이미지 기반 상품 속성 추출 예시
이미지 기반 상품 색상 추출 예시
Catalog Matching System Overview