기법/방법론중급
Retrieval
검색 · Retrieval / Information Retrieval
대규모 데이터 저장소에서 질문이나 쿼리에 관련된 정보를 찾아내는 기술
상세 설명
Retrieval (검색)
RAG에서 R에 해당하는 핵심 기술입니다.
방식
- 키워드 검색 (BM25): 전통적, 단어 매칭
- 시맨틱 검색: 의미 기반, 임베딩 유사도
- 하이브리드 검색: 키워드 + 시맨틱 결합
랭킹
검색 결과를 관련성 순으로 정렬
- Cross-Encoder: 정확하지만 느림
- Bi-Encoder: 빠르지만 덜 정확
- Re-ranker: 1차 검색 후 재정렬
AI에서의 중요성
RAG의 성능 = 검색의 품질 × LLM의 생성 능력
→ 검색이 나쁘면 LLM이 아무리 좋아도 소용 없음
태그
#RAG#검색#데이터