텍스트 분석 기술

긴 글과 짧은 검색쿼리에서 정보를 추출하고 분석하여, 검색 뿐만 아니라 다양한 기술 및 서비스들에 활용되는 NLP 기반 기술 연구

언어 분석기 (Lexical Analyzer)

모든 NLP 기술의 기반이 되는 형태소 분석.

  • 20년 이상 최적화된 엔진

  • 10여 개 이상 언어 지원 (KO, JP, ZH-CN, ZH-TW, VI, ID, DE, …)

  • 20여 가지 이상의 분석 옵션 제공

  • 구문, 철자 오류, 미등록어에 강건

  • 신조어 추출 및 사전 강화 자동화

개체명 연결 (Entity Linking)

비정형의 텍스트에서 Name Entity를 찾고 , NAVER의 체계화된 DB에서 일치하는 Entity와 연결.

  • Named Entity Linking

  • Named Entity Recognition

감정 분석 (Sentiment Analysis)

Bert 기반의 Knowledge Distillation을 통한 품질 향상된 모델과 패턴, 로직이 결합된 Ensemble 의 형태를 가진 기술의 집합.

  • Text Classification

문서 요약 (Text Summarization)

사용자의 정보 이해 편의를 위하여 문장의 핵심내용으로 요약.

쿼리 이해 (Query Understanding)

질의 의도 및 질의 포함 정보 분석.

  • Topic detection

  • Search intent/intention

  • Query Disambiguation

  • Query representation

Last updated