Atlas Vector Search를 사용하여 로컬 RAG 구현 구축

이 페이지의 내용

배경
전제 조건
로컬 배포 또는 Atlas 클러스터 만들기
환경 설정
로컬 모델로 임베딩 생성
Atlas Vector Search 인덱스 만들기
로컬 LLM으로 질문에 답변하기

이 튜토리얼은 API 키나 크레딧 없이 로컬에서 검색 증강 생성(RAG)을 구현하는 방법을 보여줍니다. RAG에 대해 자세히 알아보려면 Atlas Vector Search를 사용한 검색 증강 생성(RAG)을 참조하세요.

구체적으로 다음 조치를 수행합니다.

로컬 Atlas 배포서버 만들거나 cloud 에 클러스터 배포 .
환경을 설정합니다.
로컬 임베딩 모델을 사용하여 벡터 임베딩을 생성합니다.
데이터에 Atlas Vector Search 검색 인덱스를 만듭니다.
로컬 LLM을 사용하여 데이터 관련 질문에 답합니다.

➤ 언어 선택 드롭다운 메뉴를 사용하여 이 페이지에 있는 예시의 언어를 설정합니다.

언어 선택

팁

이 튜토리얼의 실행 가능한 버전으로 Python 노트북작업하세요.

배경

이 튜토리얼을 완료하려면 Atlas CLI를 사용하여 로컬 Atlas 배포를 생성하거나 클라우드에 클러스터를 배포할 수 있습니다. Atlas CLI는 MongoDB Atlas의 명령줄 인터페이스이며, Atlas CLI를 사용하여 터미널에서 로컬 Atlas 배포를 생성하는 등 다양한 작업을 위해 Atlas와 상호 작용할 수 있습니다. 자세한 내용은 Atlas CLI에서 로컬 및 Cloud 배포 관리를 참조하세요.

참고

로컬 Atlas 배포는 테스트 목적으로만 사용할 수 있습니다. 프로덕션 환경의 경우에는 클러스터를 배포하세요.

이 튜토리얼에서는 다음과 같은 오픈 소스 모델도 사용합니다.

Nomic Embed 텍스트 임베딩 모델
Mistral 7B 생성 모델

LLM을 로컬로 다운로드하고 배포하는 방법에는 여러 가지가 있습니다. 이 튜토리얼에서는 Ollama를 다운로드하고 위에 나열된 오픈소스 모델을 가져와서 RAG 작업을 수행합니다.

이 튜토리얼에서는 Microsoft.Extensions.AI.Ollama 패키지를 사용하여 이러한 모델에 연결하고 Atlas Vector Search와 통합합니다. 다른 모델이나 다른 프레임워크를 선호하는 경우 Ollama 모델 이름을 원하는 설정에 맞는 모델 이름으로 대체하여 이 튜토리얼을 조정할 수 있습니다.

이 튜토리얼에서는 다음과 같은 오픈 소스 모델도 사용합니다.

Nomic Embed 텍스트 임베딩 모델
Mistral 7B 생성 모델

또한 이 튜토리얼에서는 인기 있는 오픈 소스 LLM 프레임워크인 LangChain의 Go 언어 포트를 사용하여 이러한 모델에 연결하고 Atlas Vector Search와 통합합니다. 다른 모델이나 다른 프레임워크를 선호하는 경우 Ollama 모델 이름과 LangChain 라이브러리 구성 요소를 원하는 설정을 위한 모델 및 구성 요소로 대체하여 이 튜토리얼을 조정할 수 있습니다.

LLM을로컬에 다운로드 하고 배포 방법에는 여러 가지가 있습니다. 이 튜토리얼에서는 Ollama를 다운로드 하고 다음 오픈 소스 모델을 가져와서 RAG 작업을 수행합니다.

Nomic Embed 텍스트 임베딩 모델
Mistral 7B 생성 모델

또한 이 튜토리얼에서는 널리 사용되는 Java 용 오픈 소스 LLM 프레임워크 LangChain4j를 사용하여 이러한 모델에 연결하고 Atlas Vector Search 와 통합합니다. 다른 모델이나 다른 프레임워크 선호하는 경우 Ollama 모델 이름 또는 LangChain4j 라이브러리 구성 요소를 원하는 설정 에 해당하는 것으로 대체하여 이 튜토리얼을 조정할 수 있습니다.

이 튜토리얼에서는 다음과 같은 오픈 소스 모델도 사용합니다.

mxbai-embed-large-v1 임베딩 모델
Mistral 7B 생성 모델

LLM을 로컬로 다운로드하고 배포하는 방법에는 여러 가지가 있습니다. 이 튜토리얼에서는 로컬 LLM개발을 위한 오픈 소스 에코시스템인 GPT4All을 사용하여 Mistral 7B 모델을 다운로드합니다.

이 튜토리얼을 진행할 때는 대화형 Python 노트북을 사용하세요. 이 환경에서는 매번 전체 파일을 실행하지 않고도 개별 코드 블록을 만들고 실행할 수 있습니다.

이 튜토리얼에서는 다음과 같은 오픈 소스 모델도 사용합니다.

mxbai-embed-large-v1 임베딩 모델
Mistral 7B 생성 모델