용어집
- 계층적 탐색 가능한 작은 세계 그래프
- 다차원 공간에서 효율적인 최근접 이웃 검색 을 수행하기 위한 알고리즘입니다. Atlas Vector Search 는 Hierarchical Navigable Small Worlds 를 사용하여 ANN검색 을 수행합니다.
- 경고
데이터베이스 작업 또는 서버 사용량이 클러스터 성능에 영향을 미치는 임계값에 도달하면 Atlas 에서 보내는 알림입니다. 어떤 조건을 설정하다 하여 경고를 trigger 할 수 있는지 학습 보려면 경고 조건 검토를 참조하세요.
- 분석 노드
- 운영 워크로드에 영향을 주지 않는 쿼리를 격리할 수 있는 특수한 읽기 전용 노드입니다.분석 노드는 BI 도구에서 실행되는 보고 쿼리 같은 분석 데이터를 처리하는 데 유용합니다.읽기 성능을 최적화하고 지연 시간을 줄이기 위해 전용 지리적 리전에서 분석 노드를 호스팅할 수 있습니다.
- API
클라이언트와 MongoDB Atlas 간의 상호 작용을 촉진하는 통신 프로토콜입니다. Atlas Administration API를 사용하여 Atlas UI에서 수행되는 여러 작업을 자동화할 수 있습니다.
- 근사치 근접 이웃(ANN) 검색
- 데이터세트에서 지정된 쿼리 점 에 가까운 점을 빠르게 찾는 데 사용되는 계산 기술입니다. Atlas Vector Search 는 ANN 검색 을 사용하여 모든 벡터를 스캔하지 않고도 Atlas Vector Search 쿼리 의 벡터 임베딩에 가장 가까운 데이터에서 벡터 임베딩을 찾습니다.
- Atlas Search
추가로 필요한 관리 없이 데이터에 대한 고급 텍스트 검색을 가능하게 하는 세분화된 텍스트 인덱싱입니다. Atlas Search는 여러 종류의 분석기, 점수 기반 결과 순위 및 풍부한 쿼리 언어에 대한 옵션을 제공합니다.
- Atlas user
Atlas 애플리케이션에 액세스하는 데 사용되는 계정입니다. 사용자 역할에 따라 정의된 특정 권한으로 Atlas 사용자에게 Atlas 조직, 프로젝트 또는 둘 모두에 대한 액세스 권한을 부여할 수 있습니다. Atlas 사용자는 데이터베이스 사용자와 다릅니다. Atlas 사용자는 MongoDB 데이터베이스에 대한 액세스 권한을 제공하지 않습니다.
- Atlas 사용자 역할
- Atlas Vector Search
- 쿼리 벡터를 인덱싱된 벡터와 비교하여 가장 가까운 일치 항목을 찾는 방식으로 벡터 임베딩에 대한 시맨틱 검색 을 수행할 수 있는 Atlas 의 기능입니다.
- 자동 확장
클러스터 사용량에 따라 클러스터가 클러스터 계층, 스토리지 용량 또는 둘 모두를 자동으로 늘리거나 줄이도록 구성할 수 있는 옵션입니다.
- 백업
지정된 시간에 클러스터 상태를 캡슐화하는 데이터 사본입니다. 백업은 데이터 손실이 발생할 경우 안전 조치를 제공합니다.
Atlas 는 관리형 클라우드 백업을 제공합니다.
- 클라우드 백업
클러스터 클라우드 서비스 제공자의 네이티브 스냅샷 기능을 사용하여 현지화된 클러스터 백업 스토리지입니다.
Atlas는 다음에서 제공되는 cluster에 대해 cloud 백업을 지원합니다.
- cluster
- MongoDB 배포서버를 구성하는 노드의 집합입니다. Atlas에서 클러스터는 복제본 세트 또는 샤딩된 배포서버가 될 수 있습니다.
- 클러스터 클래스
Amazon Web Services에 호스팅되는 M40+ cluster에 맞게 구성할 수 있습니다.
클러스터의 스토리지 클래스입니다.선택한 클래스는 클러스터 스토리지 성능 및 클러스터 비용에 영향을 줍니다.다음 클래스 중 하나를 선택할 수 있습니다.
Low CPU
General
Local NVMe SSD
- 클러스터 계층
클러스터의 각 데이터 보유 서버에 대한 메모리, 스토리지, vCPU, IOPS 사양을 지정합니다. 클러스터 계층이 증가함에 따라 클러스터 스토리지 크기와 전체 성능이 증가합니다.
- 코사인 유사도
- 두 벡터 사이의 각도를 사용하여 해당 벡터 간의 유사성을 결정하는 지표입니다. 코사인 유사성은 벡터 방향에 민감합니다. Atlas Vector Search 에 대한 벡터 임베딩을 인덱싱 할 때 코사인 유사성 함수를 사용할 수 있습니다. 벡터가 단위 길이로 정규화되는 경우 dotProduct 유사성 함수를 대신 사용합니다.
- 사용자 지정 역할
저장하고 데이터베이스 사용자에게 할당할 수 있는 MongoDB 권한 조치 및 MongoDB 역할의 사용자 지정 집합입니다. Atlas의 기본 제공 역할이 원하는 권한 집합을 설명하지 못하는 경우 사용자 지정 역할을 생성하세요.
- 데이터 탐색기
Atlas 내의 도구로 클러스터 데이터를 보고 상호 작용할 수 있습니다. 데이터 탐색기를 사용하여 인덱스를 관리하고 집계 파이프라인을 실행하여 데이터를 처리할 수도 있습니다.
- 데이터 페더레이션
MongoDB 쿼리 언어를 사용하여 저가형 S3 버킷, Atlas 클러스터 및 HTTP 엔드포인트에 저장된 데이터를 쿼리하기 위한 MongoDB의 솔루션입니다. 분석 애플리케이션은 Atlas Data Federation 을 사용하여 데이터 처리 요구 사항에 맞게 보관된 데이터를 사용할 수 있습니다.
- 데이터 수집 파이프라인
- RAG를 사용하여 데이터를 구성하고 변환하고 Atlas 와 같은 벡터 데이터베이스 에 저장하는 워크플로입니다.
- 데이터베이스 사용자
MongoDB cluster 에 액세스 하기 위해 클라이언트 를 인증하는 데 사용되는 자격 증명입니다. 데이터베이스 사용자에게 권한 을 할당하여 클러스터 에 대한 해당 사용자의 액세스 수준을 결정할 수 있습니다. 데이터베이스 사용자는 Atlas 사용자 와 다릅니다. 데이터베이스 사용자는 Atlas 애플리케이션 이 아닌 MongoDB deployment에 액세스 할 수 있습니다.
- 데이터베이스 사용자 권한
데이터베이스 사용자에게 부여된 권한 조치 또는 역할 집합입니다. 클러스터, 데이터베이스 및 컬렉션 수준에서 데이터베이스 사용자 권한을 할당할 수 있습니다.
- 데드 레터 큐
- 데드 레터 큐는 수집 중 오류가 발생하는 문서를 저장하는 Atlas 데이터베이스 내의 collection입니다.
- 전용 클러스터
계층
M10
이상의 클러스터를 포함하는 클러스터 카테고리입니다.계층권장 환경M10
개인정보 정책에M20
개발
트래픽이 적은 프로덕션
M30
이상프로덕션
- 고밀도 벡터
- 대부분 또는 모든 차원에 0이 아닌 값이 포함된 데이터의 숫자 표현입니다. Atlas Vector Search 는 더 많은 데이터로 가득 찬 고밀도 벡터를 사용하여 더 복잡한 관계를 캡처합니다.
- 배포
- 데이터가 포함된 MongoDB 서버 그룹 입니다. Atlas 관리형 클러스터는 클러스터(복제본 세트 또는 샤딩된 클러스터)입니다.
- 차원
- 다차원 공간에서 데이터의 기능이나 속성을 구성하는 구성 요소 또는 요소의 수입니다. Atlas Vector Search 는 인덱스 시간 및 쿼리 시간에 최대
4096
차원을 지원합니다. - dotProduct 유사성
- 다차원 공간에서 두 벡터 간의 유사성을 측정하고 스칼라 값을 반환하며, 벡터가 거의 같은 방향을 점 때 양수, 벡터가 반대 방향을 점 때 음수, 벡터에 유사성이 없으면 0을 반환합니다. Atlas Vector Search 는 가장 가까운 이웃을 검색할 때
dotproduct
유사성 함수 사용을 지원합니다. 벡터가 단위 길이로 정규화된 경우 코사인 유사성 대신 이 유사성 함수를 권장합니다. - 투표 선택 가능 노드
- 복제본 세트의 프라이머리 구성원이 될 수 있는 노드입니다. Atlas는 투표 동안 프라이머리 자격을 위해 최고 우선순위 리전에 있는 노드에 우선순위를 부여합니다. 안정적인 투표를 보장하려면 전체 리전에서 투표 선택 가능 노드의 총 수가 3, 5 또는 7이어야 합니다.
- 임베딩
- 텍스트, 이미지, 오디오, 비디오 등과 같은 데이터를 다차원 공간에서 좌표로 해석될 수 있는 숫자 배열 로 표현합니다. Atlas 는 Atlas cluster 에 임베딩을 저장하는 것을 지원하며, Atlas Vector Search 는 최대
4096
차원의 벡터 임베딩에 대한 인덱싱 및 쿼리를 지원합니다. - 암호화 키
데이터를 암호화하고 복호화하기 위해 특별히 생성된 임의의 비트 문자열입니다.
Atlas
Project Owners
는 Atlas 가 제공하는 기본값 미사용 데이터 암호화 데이터 암호화 외에도 데이터에 추가 암호화 계층을 구성할 수 있습니다. 프로젝트 소유자는 MongoDB 암호화됨 스토리지 엔진과 함께 Atlas 호환 고객 키 관리 제공자 를 사용할 수 있습니다.Atlas는 미사용 데이터 암호화를 구성할 때 다음 고객 키 관리 제공자를 지원합니다.
- 유클리드 유사성
- 다차원 공간에서 두 벡터 사이의 거리를 사용하여 유사성을 계산하는 공식입니다. 유클리드 거리는 벡터의 크기에 민감합니다. Atlas Vector Search 는 벡터를 인덱싱 하고 가장 가까운 이웃을 검색할 때
euclidean
유사성 함수를 사용할 수 있도록 지원합니다. - 프리 티어
데이터를 호스팅하기 위한 소규모 개발 환경을 제공하는 무료 클러스터 계층입니다. 무료 클러스터는 만료되지 않으며, Atlas의 일부 기능에 대한 액세스를 제공합니다. 무료 클러스터는 인스턴스 크기
M0
로도 참조할 수 있습니다.- 글로벌 클러스터
전 세계에 분산된 애플리케이션 인스턴스 및 클라이언트에 대한 위치 인식 읽기 및 쓰기 (write) 작업을 지원하기 위해 지리적 구역이 정의된 클러스터입니다. 계층
M30
이상의 클러스터에서 글로벌 샤딩을 활성화할 수 있습니다.- 글로벌 쓰기 영역
글로벌 클러스터 배포의 하위 집합을 나타내는 지리적 구역입니다. 각 글로벌 클러스터는 최대 9개의 개별 글로벌 쓰기 구역을 지원합니다. 각 구역은 하나의 최우선 순위 리전과 하나 이상의 투표 선택 가능, 읽기 전용 또는 분석 리전으로 구성됩니다.
사용 가능한 지리적 리전은 선택한 클라우드 서비스 제공자에 따라 다릅니다.
- 그룹
- 프로젝트를 참조하세요.
- groupId
- 프로젝트 ID를 참조하세요.
- 최우선 순위 리전
Atlas가 투표 중 프라이머리 자격에 대해 우선순위를 지정하는 멀티 리전 클러스터의 리전입니다.
- 하이브리드 검색
- 전체 텍스트 및 시맨틱 검색 과 같은 서로 다른 검색 방법을 결합하여 각각의 장점을 활용하는 방법입니다. 결과는 RRF(Reciprocal Rank Federation)와 같은 기술을 사용하여 결합됩니다.
- 영향
Performance Advisor가 제안하는 인덱스의 예상 성능 향상입니다.
- 인터페이스 엔드포인트
AWS AWS PrivateLink를 통해 Atlas 비공개 엔드포인트 서비스로 트래픽을 전송하는 비공개 IP 주소가 있는 VPC 엔드포인트입니다.
- IP 액세스 목록
Atlas 프로젝트 내 클러스터에 액세스할 수 있는 IP 주소 및 CIDR 블록 목록입니다. 공용 인터넷을 통한 클라이언트 연결의 경우, Atlas는 해당 프로젝트의 IP 액세스 목록에 있는 항목에서만 클러스터에 대한 연결을 허용합니다. 액세스 목록에는 최대 200 개의 항목이 있을 수 있습니다.
Atlas 는 네트워크 피어링 연결 또는 비공개 엔드포인트 와 같은 비공개 네트워킹을 통한 클라이언트 연결도 허용합니다. 이러한 유형의 연결은 IP 액세스 목록 과 관계없이 작동합니다. 학습 내용 은 네트워크 피어링 연결 설정 및 Atlas 의 비공개 엔드포인트에 대해 알아보기를 참조하세요.
- K-최근접 이웃 검색
- 정의된 유사성 함수 S 가 있는 점 설정하다 P 가 주어지면 쿼리 점 q 에 대해 은 P 에서 S*(*p ,q)의 가장 좋은 값을 가진k 개의 점 설정하다 를 찾습니다. Atlas Vector Search ENN 검색 은 정확한 상위 k개의 점을 반환하고,ANN 검색 은 q와 유사한 k개의 점을 반환하지만,k가 반드시 q와 가장 유사한 것은 아닙니다.
- LDAP
사용자를 인증하고 클러스터의 데이터에 액세스할 수 있는 권한을 부여하는 데 사용되는 크로스 플랫폼 프로토콜입니다.Atlas를 사용하면 TLS를 통해 자체 LDAP 서버를 사용하는 모든 MongoDB 클라이언트의 사용자 인증 및 권한 부여를 관리할 수 있습니다.단일 LDAPS 구성은 Atlas 프로젝트의 모든 클러스터에 적용됩니다.
- 링크 토큰
Cloud Manager 또는 Ops Manager 배포에서 Atlas의 클러스터로 실시간 마이그레이션하는 동안 Cloud Manager 또는 Ops Manager에서 Atlas로 연결하는 데 필요한 정보가 포함된 문자열입니다.
Cloud Manager 또는 Ops Manager 배포에서 데이터를 실시간 마이그레이션할 준비가 되면 Atlas에서 링크 토큰을 생성한 다음 Cloud Manager 또는 Ops Manager 조직의 설정에 입력합니다.동일한 링크 토큰을 사용하여 Cloud Manager 또는 Ops Manager 조직의 각 배포를 순차적으로 한 번에 하나씩 마이그레이션합니다.Atlas에서는 여러 개의 링크 토큰을 생성할 수 있습니다. 각 Cloud Manager 또는 Ops Manager 조직에 대해 하나의 고유한 링크 토큰을 사용합니다.
- 라이브 마이그레이션
기존 소스 복제본 세트 또는 샤딩된 클러스터를 Atlas로 원활하게 이동하는 프로세스입니다.실시간 마이그레이션 프로세스 중에 Atlas는 애플리케이션을 Atlas 클러스터로 전환할 때까지 대상 클러스터를 원격 소스와 동기화 상태로 유지합니다. Atlas는 두 가지 실시간 마이그레이션 모드를 제공합니다.
푸시 실시간 마이그레이션은 Atlas 사용자 인터페이스에서 Live Migration from Ops Manager or Cloud Manager로 알려져 있으며, Atlas가 Cloud Manager 또는 Ops Manager에서 Atlas로 배포를 푸시합니다.
Atlas 사용자 인터페이스에서는 General Live Migration로 알려진 실시간 마이그레이션을 가져옵니다. 여기서 Atlas는 클라우드 또는 온프레미스 배포에서 Atlas로 배포를 가져옵니다.
- 유지 관리 기간
Atlas 가 클러스터 에 대한 주간 유지 관리를 시작해야 하는 요일 및 시간입니다. 프로젝트 설정에서 유지 관리 기간 을 설정하다 수 있습니다.
중요
유지 관리 기간 고려 사항
- 긴급 유지 관리 활동
- 보안 패치와 같은 긴급 유지 관리 활동은 선택한 기간을 기다릴 수 없습니다. Atlas는 필요시 이러한 유지 관리 활동을 시작하게 됩니다.
- 지속적인 유지 관리 작업
- 클러스터에 대한 유지 관리 일정을 잡은 후에는 현재 유지 관리 작업이 완료되기까지 유지 관리 기간을 변경할 수 없습니다.
- 유지 관리 시 복제본 세트 필요
- Atlas는 MongoDB 매뉴얼에 설명된 유지 관리 절차와 동일한 방식으로 유지 관리를 수행합니다. 이 절차를 수행하려면 유지 관리 기간 동안 복제본 세트당 하나 이상의 복제본 세트 투표가 요구됩니다.
- 최대한 정시 유지 관리 시작
- 유지 관리는 항상 가급적 예정된 시간에 가깝게 시작하지만, 진행 중인 클러스터 업데이트 또는 예기치 않은 시스템 문제로 인해 시작 시간이 지연될 수 있습니다.
- MongoDB 차트
Atlas 데이터를 위한 시각화 도구입니다. Atlas 클러스터에서 MongoDB Charts를 실행하고 데이터 시각화를 시작할 수 있는 Charts 애플리케이션을 사용하여 데이터를 볼 수 있습니다.
- 멀티 리전 클러스터
여러 지리적 리전에 걸친 Atlas 클러스터입니다.멀티 리전 클러스터는 애플리케이션 쿼리를 가장 적절한 지리적 리전으로 라우팅하여 가용성을 높이고 성능을 개선할 수 있습니다.
멀티 리전 클러스터에는 투표 선택 가능 노드가 포함되어야 합니다.
- namespace
database.collection
형식의 데이터베이스 이름과 컬렉션 이름의 조합입니다.- 네임스페이스 인사이트
컬렉션 수준 쿼리 지연 시간 을 모니터링하는 Atlas 도구입니다. 특정 호스트 및 작업 유형에 대한 쿼리 지연 시간 지표 및 통계를 볼 수 있습니다. 고정된 네임스페이스를 관리하고 해당 쿼리 지연 시간 Atlas Charts에 표시할 네임스페이스를 최대 5개까지 선택합니다.
- 네트워크 피어링 연결
두 개의 인터넷 네트워크가 연결되어 트래픽을 교환하는 프로세스입니다.MongoDB cluster를 위해 생성된 Atlas VPC로 VPC를 직접 피어링할 수 있습니다.네트워크 피어링을 사용하면 애플리케이션 서버가 공용 네트워크와 격리된 상태에서 Atlas에 직접 연결할 수 있습니다.
- NVMe 스토리지
AWS에서 호스팅되는 M40+ 클러스터에서 사용 가능
지연 시간이 짧고 처리량이 많은 IO가 필요한 AWS에서 호스팅되는 애플리케이션의 경우 NVMe 클러스터 클래스를 사용할 수 있습니다.NVMe 클러스터 클래스는 고유한 데이터 프로토콜을 활용하여 데이터 액세스 속도를 크게 향상시킵니다.
NVMe 클러스터는 처리량과 IOPS 가 높은 프로비저닝된 볼륨으로 구성된 숨겨진 세컨더리 노드 를 사용하여 백업을 용이하게 합니다.
- 운영 노드
- Atlas cluster 의 투표 선택 가능 노드 또는 읽기 전용 노드 입니다.
- 조직
Atlas 프로젝트의 논리적인 그룹화입니다.조직을 활용하여 조직에 포함된 프로젝트에 대한 청구, 사용자, 보안 설정을 관리할 수 있습니다.
청구는 각 프로젝트의 사용량에 대한 가시성을 유지하면서 조직 수준에서 발생합니다.
조직 내의 모든 프로젝트를 볼 수 있습니다.
팀을 사용하여 조직 사용자를 조직 내의 프로젝트에 일괄 할당할 수 있습니다.
- 조직 ID
- 조직 을 식별하는 데 24사용되는 고유한 자리 16진수 입니다.string Atlas Return All Organizations 엔드포인트는 API 호출을 실행하는 인증된 사용자가 액세스할 수 있는 모든 조직의 ID를 반환합니다.
- Performance Advisor
클러스터에서 실행되는 느린 쿼리를 모니터링하고 쿼리 성능을 개선하기 위한 인덱스를 제안하는 Atlas 도구입니다. Performance Advisor가 제안하는 각 지표에는 해당 지표가 가져올 수 있는 잠재적인 성과 개선 효과를 나타내는 영향 점수가 포함되어 있습니다.
- 기본
- 복제본 세트에서 프라이머리는 모든 쓰기 작업을 수신하는 멤버입니다. 멀티 리전 클러스터에서 Atlas는 투표 기간 동안 프라이머리 자격을 위해 최우선 순위 리전에 있는 노드에 우선 순위를 지정합니다.
- 프로젝트
클러스터의 논리적 그룹화. 단일 프로젝트 내에 클러스터가 여러 개 있을 수 있으며, 단일 조직 내에 프로젝트가 여러 개 있을 수 있습니다.
참고
프로젝트는 그룹과 동의어입니다.
- 프로젝트 ID
프로젝트 를 식별하는 데 24사용되는 고유한 자리 16진수 string Atlas 입니다. 모든 프로젝트 가져오기 API 엔드포인트는 API 호출을 실행하는 인증된 사용자가 액세스할 수 있는 모든 프로젝트의 ID를 반환합니다.
참고
프로젝트 ID는 그룹 ID와 동의어입니다.
- 양자화
- 양자화는 더 많은 벡터 또는 더 높은 차원의 벡터를 저장 수 있도록 차원 값을 더 작은 범위 로 압축하는 프로세스 입니다. Atlas Vector Search 는 메모리 및 저장 비용을 줄이기 위해 완전 충실도 벡터의 자동 양자화를 지원하고, 임베딩 모델에서 스칼라 및 이진 양자화된 벡터의 수집 및 인덱싱 을 지원합니다.
- Query 프로파일러
클러스터의 성능 문제를 진단하고 모니터링하는 Atlas 도구입니다.쿼리 프로파일러는 장기간 실행되는 쿼리와 해당 쿼리의 성능 통계를 노출할 수 있습니다.쿼리 프로파일러에서 반환된 데이터를 필터링하여 특정 네임스페이스 및 작업 유형에 집중할 수 있습니다.
- 읽기 전용 노드
- 복제본 세트는 투표 선택 가능 노드 리전을 보완하는 전용 지리적 리전에 있습니다. 읽기 전용 노드를 사용하여 가장 자주 읽는 데이터를 로컬라이즈하여 성능을 개선할 수 있습니다.
- 실시간 성능 패널
현재 네트워크 트래픽, 클러스터의 데이터베이스 작업, 호스트 머신에 대한 hardware 통계를 표시하는 Atlas 모니터링 서비스입니다.RTPP를 사용하여 쿼리 실행 시간을 시각적으로 평가하고, 네트워크 활동을 모니터링하고, 복제본 세트의 세컨더리 노드에 대한 잠재적인 복제 지연을 발견할 수 있습니다.
- 리콜
- ANN 검색 에서 반환된 실제 가장 가까운 이웃의 비율을 측정합니다. 이 측정값은 알고리즘 이 ENN 검색 결과를 근사화하는 정도를 반영합니다. Recall@k 표기법은 Atlas Vector Search 에서 반환된 상위 k개 결과에 존재하는 실제 가장 가까운 이웃의 수를 측정한 값을 나타냅니다.
- replicaSet
동일한 데이터 세트를 유지 관리하는 MongoDB Server 그룹입니다. 복제본 세트는 중복성과 고가용성을 제공하며 모든 프로덕션 배포에 대한 기반입니다.
- 롤링 재시작
- 클러스터의 모든 노드를 순차적으로 재시작하는 프로세스입니다. 클러스터 가용성을 유지하기 위해 Atlas는 세컨더리 노드부터 시작하여 한 번에 한 노드씩 재시작합니다. Atlas는 롤링 재시작이 완료될 때까지 항상 프라이머리 노드를 유지합니다.
- 스칼라 양자화
- 스칼라 양자화에는 각 차원에 대해 세그먼트 내의 모든 인덱스 벡터에서 최소값과 최대값을 선택하고 그 사이에 동일한 크기의 빈을 생성하는 작업이 포함됩니다. 이러한 각 차원을 빈에 매핑하면 새로운 양자화된 값이 생성됩니다. Atlas Vector Search 는 부동 소수점32 벡터에 대한 자동 스칼라 양자화와 임베딩 제공자로부터 스칼라 양자화된 벡터의 수집 및 인덱싱 을 지원합니다.
- 시맨틱 검색
- 쿼리 와 의미가 비슷한 값을 검색합니다. 시맨틱 검색 은 어휘 중복이 없는 경우에도 단어나 구 간의 자연스러운 관계 를 캡처합니다. 시맨틱 검색 과 벡터 검색 은 종종 같은 의미로 사용됩니다. Atlas Vector Search 는 Atlas cluster에 저장된 벡터 데이터에 대한 시맨틱 검색 을 지원합니다.
- 샤딩된 클러스터
샤딩된 MongoDB 배포를 구성하는 노드 집합입니다. 샤딩된 클러스터는 config 서버, 샤드, 하나 이상의
mongos
라우팅 프로세스로 구성됩니다.- 공유 클러스터
M0
(프리 티어),M2
,M5
계층 클러스터를 포함하는 클러스터 카테고리입니다. 공유 클러스터는 일반적으로 개발 및 소규모 프로덕션 워크로드에 사용됩니다.- 유사성 함수
- 두 벡터 간의 유사성을 측정합니다. Atlas Vector Search 는
euclidean
,cosine
및dotProduct
유사성 함수를 지원합니다. - 스냅샷
특정 간격으로 캡처하여 백업 데이터 센터 에 저장된 데이터를 백업합니다. 스냅샷 일정은 스냅샷을 찍는 간격과 스냅샷을 저장 하는 기간을 결정합니다.
- 팀
동일한 조직의 Atlas 사용자 그룹입니다. 팀을 사용하여 여러 프로젝트에서 동일한 Atlas 사용자 그룹에 액세스 권한을 부여할 수 있습니다. 팀의 모든 사용자는 동일한 프로젝트 액세스 권한을 공유합니다.
참고
Atlas 사용자는 여러 팀에 소속될 수 있습니다.
- 토폴로지
다음 세부 정보를 포함하는 MongoDB 인스턴스 배포 상태입니다.
- 벡터 데이터베이스
- 벡터 임베딩 및 관련 메타데이터 를 저장하고 저장된 벡터 임베딩에서 가장 가까운 이웃 검색 을 활성화하는 시스템입니다. Atlas 를 벡터 데이터베이스 로 사용하고 Atlas Vector Search 를 사용하여 저장된 벡터 임베딩에 대해 벡터 검색 검색을 수행할 수 있습니다. 벡터 데이터베이스 를 사용하여 RAG를 구현 수 있습니다.
- 벡터 인덱스
- 가장 가까운 이웃 검색 쿼리를 효율적으로 처리하는 데이터 구조입니다. Atlas Vector Search 는 쿼리를 실행 하기 위한 필드를 인덱스
vector
하기$vectorSearch
위해 유형의 인덱스 생성을 지원합니다. - Vector Search
- 벡터 인덱스 에 저장된 벡터 설정하다 에 대해 k 가장 가까운 이웃 검색 을 수행하는 방법입니다. Atlas Vector Search 는 k개의 가장 가까운 이웃에 대한 ANN 및 ENN 검색 을 지원합니다.