2025-04-08T19:56:24

This commit is contained in:
2025-04-08 19:56:24 +09:00
parent a75a1dbd0f
commit eef061c1c9
100 changed files with 18639 additions and 0 deletions

392
docs/full text search.md Normal file
View File

@@ -0,0 +1,392 @@
# **MariaDB 풀 텍스트 검색 (Full-Text Search) 완벽 가이드**
**풀 텍스트 검색(Full-Text Search, FTS)**은 일반적인 `LIKE` 연산자보다 강력한 검색 기능을 제공하는 MariaDB의 주요 기능 중 하나입니다.
대량의 텍스트 데이터를 빠르게 검색할 수 있도록 **인덱스를 활용한 고속 검색, 랭킹(관련성 점수) 기반 정렬, 논리 연산자 지원** 등의 기능을 제공합니다.
이 글에서는 **MariaDB의 풀 텍스트 검색 개념, 설정 방법, 사용법, 고급 기능**까지 단계별로 설명하겠습니다.
---
## **1. 풀 텍스트 검색(Full-Text Search)란?**
### **📌 풀 텍스트 검색의 특징**
- **일반적인 `LIKE` 검색보다 훨씬 빠름** (전문 검색 인덱스를 사용)
- **단어 단위 검색**이 가능 (`LIKE '%word%'`는 문자열 전체에서 검색하지만, FTS는 단어를 인식)
- **복잡한 검색 연산 지원** (`MATCH ... AGAINST`를 이용한 자연어 검색, 불리언(Boolean) 검색)
- **인덱스를 활용하여 검색 성능 최적화** (`FULLTEXT` 인덱스 사용)
- **정렬 기준을 제공** (관련성 점수를 반환하여 가장 연관성 높은 결과부터 출력 가능)
---
## **2. 풀 텍스트 검색을 위한 기본 설정**
### **✅ 1. 테스트용 테이블 생성**
MariaDB에서 풀 텍스트 검색을 사용하려면, **TEXT 또는 VARCHAR 컬럼에 `FULLTEXT` 인덱스를 추가해야 합니다.**
```sql
CREATE TABLE articles (
id INT AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(255),
content TEXT,
FULLTEXT (title, content) -- 풀 텍스트 인덱스 추가
) ENGINE=InnoDB;
```
`FULLTEXT (title, content)`**title과 content 컬럼을 대상으로 풀 텍스트 검색 지원**
`ENGINE=InnoDB`**MariaDB 10.0.5 이상부터 InnoDB에서도 지원 (기존에는 MyISAM 전용)**
---
### **✅ 2. 테스트 데이터 삽입**
```sql
INSERT INTO articles (title, content) VALUES
('MariaDB 풀 텍스트 검색', 'MariaDB의 FULLTEXT 검색은 강력한 검색 기능을 제공합니다.'),
('MySQL과 MariaDB 비교', 'MariaDB는 MySQL의 오픈소스 버전이며, 여러 기능을 개선했습니다.'),
('MariaDB 성능 튜닝', 'MariaDB의 성능을 향상시키는 방법에 대해 설명합니다.');
```
---
## **3. 기본적인 풀 텍스트 검색 사용법**
### **✅ 1. `MATCH ... AGAINST`를 이용한 검색**
MariaDB에서 풀 텍스트 검색을 수행하려면 **`MATCH(컬럼명) AGAINST ('검색어')`** 구문을 사용합니다.
```sql
SELECT id, title, MATCH(title, content) AGAINST ('MariaDB') AS relevance
FROM articles
WHERE MATCH(title, content) AGAINST ('MariaDB');
```
`MATCH(title, content) AGAINST ('MariaDB')`**"MariaDB"를 포함하는 레코드 검색**
`relevance` (관련성 점수) 반환 → **높은 점수를 가진 데이터가 더 관련성이 높음**
**📌 실행 결과 예시:**
| id | title | relevance |
|----|----------------|------------|
| 1 | MariaDB 풀 텍스트 검색 | 1.2 |
| 3 | MariaDB 성능 튜닝 | 0.8 |
**✅ 장점:**
- 일반적인 `LIKE '%검색어%'`보다 훨씬 빠른 검색 속도
- 관련성 점수를 기준으로 정렬 가능
---
### **✅ 2. 불리언(Boolean) 모드 검색**
불리언 모드를 사용하면 **논리 연산자(+,-,*,~ 등)를 이용해 복잡한 검색 조건을 적용할 수 있습니다.**
```sql
SELECT id, title
FROM articles
WHERE MATCH(title, content) AGAINST ('+MariaDB -MySQL' IN BOOLEAN MODE);
```
`+MariaDB`**"MariaDB"가 반드시 포함된 문서만 검색**
`-MySQL`**"MySQL"이 포함된 문서는 제외**
**📌 주요 연산자 정리**
| 연산자 | 설명 |
|--------|------|
| `+` | 반드시 포함 (예: `+MariaDB`) |
| `-` | 포함되면 제외 (예: `-MySQL`) |
| `*` | 와일드카드 (예: `Mari*` → Maria, MariaDB 모두 검색) |
| `~` | 관련성을 낮춤 (예: `~튜닝` → "튜닝" 단어가 있는 경우 가중치를 낮춤) |
| `""` | 정확한 문구 검색 (예: `"MariaDB 풀 텍스트"`) |
---
## **4. 고급 검색 기능**
### **✅ 1. 자연어(Natural Language) vs 불리언(Boolean) 검색 비교**
MariaDB에서는 **자연어 검색(Natural Language Mode)**과 **불리언 검색(Boolean Mode)** 두 가지 모드를 지원합니다.
#### **📌 자연어 검색 (기본값)**
```sql
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST ('MariaDB');
```
**관련성 점수 기반 검색**
✔ 자동으로 불필요한 단어 제거
---
#### **📌 불리언 검색**
```sql
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST ('+MariaDB -튜닝' IN BOOLEAN MODE);
```
**연산자를 사용하여 논리적으로 검색 조건 적용 가능**
**관련성 점수를 사용하지 않음**
---
### **✅ 2. 부분 일치 검색 (NGRAM 인덱스 활용)**
MariaDB에서 기본적으로 **한 단어(토큰) 단위로 검색**이 이루어지므로, **부분 검색(예: "DB" 검색)이 불가능**합니다.
이를 해결하기 위해 **ngram 인덱스**를 활용할 수 있습니다.
#### **📌 ngram 인덱스 사용법**
```sql
ALTER TABLE articles ADD FULLTEXT(title, content) WITH PARSER ngram;
```
**기본적으로 2글자 단위로 인덱싱 (bigram 방식)**
**"DB"와 같은 부분 단어 검색 가능**
---
### **✅ 3. 정렬 기준 적용 (`ORDER BY`)**
검색 결과를 **관련성(relevance) 점수를 기준으로 정렬**할 수 있습니다.
```sql
SELECT id, title, MATCH(title, content) AGAINST ('MariaDB') AS relevance
FROM articles
WHERE MATCH(title, content) AGAINST ('MariaDB')
ORDER BY relevance DESC;
```
**관련성 점수가 높은 순으로 정렬**
---
## **5. 정리**
### ✅ **MariaDB 풀 텍스트 검색 핵심 요약**
- `FULLTEXT` 인덱스를 사용하여 **빠른 텍스트 검색 가능**
- `MATCH() AGAINST()` 구문을 활용하여 검색 수행
- **불리언 검색(Boolean Mode)**을 사용하면 논리 연산을 적용 가능
- `NGRAM` 인덱스를 적용하면 **부분 검색 지원**
### ✅ **풀 텍스트 검색을 언제 사용할까?**
- **LIKE 검색이 느려질 때**
- **대량의 텍스트 데이터를 검색할 때**
- **검색어의 관련성(점수) 기준으로 정렬이 필요할 때**
MariaDB의 풀 텍스트 검색 기능을 활용하면 **강력한 검색 성능과 빠른 응답 속도를 확보할 수 있습니다!** 🚀
---
# **JPA에서 풀 텍스트 검색(Full-Text Search) 활용하기**
JPA(Hibernate)를 사용할 때 **풀 텍스트 검색(Full-Text Search)**을 적용하는 방법은 크게 두 가지입니다.
1. **데이터베이스 풀 텍스트 검색 기능 활용** (예: MariaDB의 `FULLTEXT` 인덱스)
2. **Hibernate Search (Elasticsearch, Apache Lucene 등과 연동)**
이 글에서는 **MariaDB의 `FULLTEXT` 인덱스를 활용하여 JPA에서 풀 텍스트 검색을 수행하는 방법**을 설명하겠습니다.
---
## **1. MariaDB의 `FULLTEXT` 검색을 JPA에서 사용하기**
### **✅ 1. 엔티티(Entity) 설정**
풀 텍스트 검색을 적용하려면 **TEXT 또는 VARCHAR 컬럼에 `FULLTEXT` 인덱스를 추가**해야 합니다.
#### **📌 엔티티 클래스 예제**
```java
import jakarta.persistence.*;
import lombok.Getter;
import lombok.Setter;
@Entity
@Getter
@Setter
@Table(name = "articles", indexes = {
@Index(name = "idx_fulltext_title_content", columnList = "title,content", unique = false)
})
public class Article {
@Id
@GeneratedValue(strategy = GenerationType.IDENTITY)
private Long id;
@Column(nullable = false)
private String title;
@Column(columnDefinition = "TEXT", nullable = false)
private String content;
}
```
`@Index(name = "idx_fulltext_title_content", columnList = "title,content")`
**JPA로 FULLTEXT 인덱스를 직접 설정할 수 없지만, 인덱스 지정 가능**
`@Column(columnDefinition = "TEXT")`
**TEXT 타입 필드(content)를 선언**
---
### **✅ 2. `FULLTEXT` 인덱스 수동 생성**
JPA에서는 `FULLTEXT` 인덱스를 자동으로 생성하지 않으므로, **SQL로 직접 인덱스를 추가**해야 합니다.
```sql
CREATE TABLE articles (
id INT AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(255) NOT NULL,
content TEXT NOT NULL,
FULLTEXT (title, content) -- FULLTEXT 인덱스 추가
) ENGINE=InnoDB;
```
---
### **✅ 3. JPA에서 풀 텍스트 검색 쿼리 작성**
JPA의 `@Query`를 사용하여 **`MATCH() AGAINST()`** 구문을 활용할 수 있습니다.
#### **📌 Repository 인터페이스**
```java
import org.springframework.data.jpa.repository.JpaRepository;
import org.springframework.data.jpa.repository.Query;
import org.springframework.data.repository.query.Param;
import java.util.List;
public interface ArticleRepository extends JpaRepository<Article, Long> {
@Query(value = """
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST(:keyword)
""", nativeQuery = true)
List<Article> searchByFullText(@Param("keyword") String keyword);
}
```
`MATCH(title, content) AGAINST(:keyword)`**title과 content에서 `keyword` 검색**
`nativeQuery = true`**FULLTEXT 검색은 네이티브 쿼리로 실행해야 함**
---
### **✅ 4. 서비스(Service) 계층 작성**
#### **📌 검색 기능을 수행하는 서비스 클래스**
```java
import org.springframework.stereotype.Service;
import org.springframework.transaction.annotation.Transactional;
import java.util.List;
@Service
@Transactional
public class ArticleService {
private final ArticleRepository articleRepository;
public ArticleService(ArticleRepository articleRepository) {
this.articleRepository = articleRepository;
}
public List<Article> searchArticles(String keyword) {
return articleRepository.searchByFullText(keyword);
}
}
```
---
### **✅ 5. 컨트롤러(Controller) 구현**
#### **📌 검색 API 컨트롤러**
```java
import org.springframework.web.bind.annotation.*;
import java.util.List;
@RestController
@RequestMapping("/articles")
public class ArticleController {
private final ArticleService articleService;
public ArticleController(ArticleService articleService) {
this.articleService = articleService;
}
@GetMapping("/search")
public List<Article> searchArticles(@RequestParam String keyword) {
return articleService.searchArticles(keyword);
}
}
```
`/articles/search?keyword=MariaDB`**MariaDB 관련 문서를 검색하는 API**
---
## **2. 불리언(Boolean) 검색 적용**
MariaDB의 **불리언(Boolean) 검색 모드**를 적용하면 검색 연산자(`+`, `-`, `*`, `" "`)를 사용할 수 있습니다.
### **✅ `BOOLEAN MODE` 적용 예제**
```java
@Query(value = """
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST(:keyword IN BOOLEAN MODE)
""", nativeQuery = true)
List<Article> searchByFullTextBoolean(@Param("keyword") String keyword);
```
`IN BOOLEAN MODE`**논리 연산자를 포함한 검색 수행**
#### **📌 검색 연산자 예제**
| 검색어 | 설명 |
|--------|------|
| `+MariaDB` | 반드시 "MariaDB" 포함 |
| `-MySQL` | "MySQL"이 포함된 결과 제외 |
| `Mari*` | "Maria", "MariaDB" 등 검색 가능 |
| `"MariaDB 검색"` | 정확한 문구 검색 |
---
## **3. 정렬(관련성 점수 기반)**
풀 텍스트 검색을 수행할 때 **관련성 점수를 기준으로 정렬**할 수 있습니다.
### **✅ 정렬을 적용한 Repository**
```java
@Query(value = """
SELECT *, MATCH(title, content) AGAINST(:keyword) AS relevance
FROM articles
WHERE MATCH(title, content) AGAINST(:keyword)
ORDER BY relevance DESC
""", nativeQuery = true)
List<Article> searchByRelevance(@Param("keyword") String keyword);
```
`MATCH(title, content) AGAINST(:keyword) AS relevance`**관련성 점수 계산**
`ORDER BY relevance DESC`**가장 연관성 높은 결과부터 정렬**
---
## **4. 페이징 처리 적용**
Spring Data JPA의 `Pageable`을 활용하여 검색 결과에 페이징을 적용할 수 있습니다.
### **✅ 페이징 지원 Repository**
```java
import org.springframework.data.domain.Page;
import org.springframework.data.domain.Pageable;
@Query(value = """
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST(:keyword)
""", nativeQuery = true)
Page<Article> searchByFullTextPaged(@Param("keyword") String keyword, Pageable pageable);
```
`Page<Article>` 반환 → **Spring Data JPA의 페이징 기능을 활용 가능**
---
## **5. 정리**
### **✅ JPA에서 MariaDB 풀 텍스트 검색 활용 방법**
- `FULLTEXT` 인덱스를 적용하여 빠른 검색 수행
- `MATCH() AGAINST()`를 활용한 검색 쿼리 작성 (`BOOLEAN MODE` 지원)
- 관련성 점수 기반 정렬 가능 (`ORDER BY relevance DESC`)
- `Pageable`을 활용하여 **페이징 처리 가능**
### **📌 풀 텍스트 검색이 필요한 경우**
✔ 데이터가 많아 `LIKE '%keyword%'`로 검색할 경우 성능이 저하될 때
✔ 연관성 높은 검색 결과를 우선적으로 정렬해야 할 때
`BOOLEAN MODE`를 활용해 논리 검색(+, -, *)이 필요할 때
**MariaDB 풀 텍스트 검색을 활용하면 JPA에서도 강력한 검색 기능을 구현할 수 있습니다! 🚀**