# 텍스트 분석 기술

## 언어 분석기 (Lexical Analyzer)

모든 NLP 기술의 기반이 되는 형태소 분석.

* 20년 이상 최적화된 엔진
* 10여 개 이상 언어 지원 (KO, JP, ZH-CN, ZH-TW, VI, ID, DE, …)
* 20여 가지 이상의 분석 옵션 제공
* 구문, 철자 오류, 미등록어에 강건
* 신조어 추출 및 사전 강화 자동화

![](https://3360715702-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MXlYqHAZoTmO3t5Lqyc%2F-MiQFj1ar0QbOw_OkjV-%2F-MiQGpoabbIuJHwyAaXU%2Fimage.png?alt=media\&token=0fa398ef-fd83-4546-b753-7c0acdc5235e)

## 개체명 연결 (Entity Linking)

비정형의 텍스트에서 Name Entity를 찾고 , NAVER의 체계화된 DB에서 일치하는 Entity와 연결.

* Named Entity Linking
* Named Entity Recognition

![](https://3360715702-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MXlYqHAZoTmO3t5Lqyc%2F-MiQ3M9CelG99SNN3_Mv%2F-MiQ4srsAsfB9z8w6kWV%2Fimage.png?alt=media\&token=8fed6be6-49cf-4ca2-a2f3-5e89113a8215)

## 감정 분석 (Sentiment Analysis)

Bert 기반의 Knowledge Distillation을 통한 품질 향상된 모델과 패턴, 로직이 결합된 Ensemble 의 형태를 가진 기술의 집합.

* Text Classification

![](https://3360715702-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MXlYqHAZoTmO3t5Lqyc%2F-MiQ3M9CelG99SNN3_Mv%2F-MiQ70bubRlgJzVdvUlY%2Fimage.png?alt=media\&token=ea077fdb-edac-4b07-b7bb-e502d24366c2)

## 문서 요약 (Text Summarization)

사용자의 정보 이해 편의를 위하여 문장의 핵심내용으로 요약.

![쇼핑 리뷰 한줄 요약 프로세스 구성도](https://3360715702-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MXlYqHAZoTmO3t5Lqyc%2F-MiQFj1ar0QbOw_OkjV-%2F-MiQGC7RGApJ2z9vM99r%2Fimage.png?alt=media\&token=2058295b-9674-4824-834b-e03e5e6439d2)

## 쿼리 이해 (Query Understanding)

질의 의도 및 질의 포함 정보 분석.

* Topic detection
* Search intent/intention
* Query Disambiguation
* Query representation

![](https://3360715702-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MXlYqHAZoTmO3t5Lqyc%2F-MiV80br000A_OddK_f6%2F-MiV86R6pQv6PeCVOUKZ%2Fimage.png?alt=media\&token=77da5ef7-8869-4dcc-857e-e72ae19a761b)
