Docs Menu
Docs Home
/
MongoDB Compass
/ /

Atlas Vector Search 인덱스 생성

이 페이지의 내용

  • 이 작업에 대하여
  • 단계
  • 예시
  • 결과
  • 자세히 알아보기

버전 1.42.1 에 추가되었습니다.

MongoDB Compass를 사용하여 Atlas Vector Search 인덱스 를 만들 수 있습니다. 이러한 인덱스를 사용하면 벡터 데이터 기타 데이터 유형을 인덱싱하여 인덱싱된 필드에 대한 시맨틱 검색을 용이하게 할 수 있습니다. Atlas Vector Search 인덱스는 가장 유사한 벡터를 식별하여 벡터 데이터 인덱싱을 지원합니다. 인덱스는 쿼리 벡터와 인덱스에 저장된 벡터 간의 거리를 계산하여 유사성을 결정합니다.

Atlas Search 인덱스 를 만들려면 배포서버 가 다음 경우 중 하나와 일치해야 합니다.

  • MongoDB Atlas 에서 호스팅되는 배포이며 Atlas 클러스터 계층이 M10 이상이어야 합니다.

  • Atlas CLI를 사용하여 설정된 로컬 배포입니다.

또한 배포에서 MongoDB 버전 7.0 이상을 실행해야 합니다.

1

인덱스 탭 에서 Create 버튼을 클릭한 다음 Search Index 을 클릭합니다.

2
3

Vector Search0}을 선택합니다.

4

처음에는 다음과 같은 기본 벡터 검색 인덱스 구성을 제공해야 합니다. 나중에 구성을 수정할 수 있습니다.

필드
유형
설명

type

문자열

인덱스 유형을 식별하는 사람이 읽을 수 있는 레이블입니다. 인덱싱된 필드에 대해 벡터 검색 을 수행하려면 값이 vector 이어야 합니다. 생략하면 기본값 search 이(가) 전체 텍스트 검색 만 지원합니다.

path

문자열

인덱싱할 필드 이름입니다.

numDimensions

int

Atlas Search가 인덱스 및 쿼리 시 적용하는 벡터 차원의 수입니다. 이 값은 4096보다 클 수 없습니다.

similarity

문자열

상위 K-최근접 이웃을 검색 하는 데 사용되는 벡터 유사성 함수입니다. 다음 기능 중에서 선택합니다.

기능
설명

euclidean

벡터의 끝과 끝 사이의 거리를 측정하는 함수입니다. 이 함수를 사용하면 다양한 차원을 기준으로 유사성을 측정할 수 있습니다.

cosine

벡터 사이의 각도를 기준으로 유사성을 측정하는 함수입니다. 이 함수를 사용하면 크기에 따라 배율이 조정되지 않는 유사성을 측정할 수 있습니다.

코사인에는 크기가 0인 벡터를 사용할 수 없습니다. 코사인 유사성을 측정하려면 벡터를 정규화하고 대신 dotProduct를 사용하는 것이 좋습니다.

dotProduct

코사인과 유사하게 측정하지만 벡터의 크기를 고려하는 함수입니다. 이 함수를 사용하면 각도와 크기를 기준으로 유사성을 효율적으로 측정할 수 있습니다. dotProduct를 사용하려면 인덱스 및 쿼리 시점에 벡터를 단위 길이로 정규화해야 합니다.

5

다음 예시 정의에서는 sample_mflix.embedded_movies 컬렉션을 사용하고 plot_embedding 필드를 인덱싱하여 Atlas Vector Search 인덱스를 생성합니다.

{
"fields": [ {
"type": "vector",
"path": "plot_embedding",
"numDimensions": 1536,
"similarity": "euclidean"
} ]
}

생성된 인덱스의 상태를 보려면 Indexes 탭으로 Go 오른쪽 상단의 토글을 Search Indexes 로 설정합니다.

Status 열은 인덱스의 상태를 나타냅니다. 상태가 Ready이면 인덱스를 사용할 준비가 된 것입니다.

검색 인덱스 상태에 대한 자세한 내용은 Atlas Search 인덱스 상태를 참조하세요.

돌아가기

Atlas Search 인덱스