애그리게이션을 통한 데이터 변환
개요
이 가이드 에서는 MongoDB PHP 라이브러리를 사용하여 집계 작업 을 수행하는 방법을 학습 수 있습니다.
애그리게이션 작업은 MongoDB 컬렉션의 데이터를 처리하고 계산된 결과를 반환합니다. Query API의 일부인 MongoDB 애그리게이션 프레임워크는 데이터 처리 파이프라인 개념을 모델로 합니다. 문서는 하나 이상의 단계를 포함하는 파이프라인에 들어가고, 이 파이프라인은 문서를 애그리게이션된 결과로 변환합니다.
집계 작업은 자동차 공장과 유사합니다. 자동차 공장에는 조립 라인이 있으며, 여기에는 드릴과 용접기 등 특정 작업을 수행할 수 있는 특수 공구를 갖춘 조립 스테이션이 있습니다. 원부품이 공장에 들어오면 조립 라인에서 이를 변형하고 조립하여 완제품으로 만듭니다.
집계 파이프라인은 조립 라인이고, 집계 단계는 조립 스테이션이며, 작업 연산자는 특수 도구입니다.
애그리게이션 대 찾기 작업
찾기 조치를 사용하여 다음 조치을 수행할 수 있습니다:
반환할 문서 선택
반환할 필드 선택
결과 정렬
집계 조치를 사용하여 다음 조치를 수행할 수 있습니다:
찾기 작업 실행
필드 이름 바꾸기
필드 계산
데이터 요약
그룹 값
제한 사항
집계 작업을 수행할 때 다음 제한 사항을 고려합니다.
반환된 문서는 BSON 문서 크기 제한 인 16 메가바이트를 위반할 수 없습니다.
파이프라인 단계의 메모리 제한은 기본값 100 메가바이트입니다.
allowDiskUse
옵션을true
으로 설정하는 옵션 배열 을 만들고 배열 을MongoDB\Collection::aggregate()
메서드에 전달하여 이 제한을 초과할 수 있습니다.
집계 예시
참고
이 가이드 의 예제에서는 Atlas 샘플 데이터 세트 의 sample_restaurants
데이터베이스 에 있는 restaurants
컬렉션 을 사용합니다. 무료 MongoDB Atlas cluster 를 생성하고 샘플 데이터 세트를 로드하는 방법을 학습 보려면 Atlas 시작하기 가이드 를 참조하세요.
집계 을 수행하려면 파이프라인 단계가 포함된 배열 을 MongoDB\Collection::aggregate()
메서드에 전달합니다.
다음 코드 예시 에서는 뉴욕의 각 자치구에 있는 베이커리 수의 개수를 생성합니다. 이를 위해 다음 단계가 포함된 집계 파이프라인 을 사용합니다.
cuisine
필드 에'Bakery'
값이 포함된 문서를 필터하다 하는 $match 단계$ 그룹 그룹 를 사용하여 일치하는 문서를
borough
필드 별로 그룹화하여 각 고유 값에 대한 문서 수를 누적합니다.
$pipeline = [ ['$match' => ['cuisine' => 'Bakery']], ['$group' => ['_id' => '$borough', 'count' => ['$sum' => 1]]], ]; $cursor = $collection->aggregate($pipeline); foreach ($cursor as $doc) { echo json_encode($doc), PHP_EOL; }
{"_id":"Brooklyn","count":173} {"_id":"Queens","count":204} {"_id":"Bronx","count":71} {"_id":"Staten Island","count":20} {"_id":"Missing","count":2} {"_id":"Manhattan","count":221}
애그리게이션 설명
MongoDB 가 작업을 실행하는 방법에 대한 정보를 보려면 MongoDB 쿼리 플래너에게 설명 을 지시하면 됩니다. MongoDB 는 작업을 설명할 때 실행 계획 과 성능 통계를 반환합니다. 실행 계획은 MongoDB 가 작업을 완료할 수 있는 잠재적인 방법입니다. MongoDB 에 작업 설명을 지시하면 MongoDB 가 실행한 계획과 거부된 실행 계획이 모두 반환됩니다.
집계 작업을 설명하려면 MongoDB\Operation\Aggregate
객체 를 구성하고 데이터베이스, 컬렉션 및 파이프라인 단계를 매개변수로 전달합니다. 그런 다음 MongoDB\Operation\Aggregate
객체 를 MongoDB\Collection::explain()
메서드에 전달합니다.
다음 예시 에서는 앞의 애그리게이션 예제의 집계 작업을 설명하도록 MongoDB 에 지시합니다.
$pipeline = [ ['$match' => ['cuisine' => 'Bakery']], ['$group' => ['_id' => '$borough', 'count' => ['$sum' => 1]]], ]; $aggregate = new MongoDB\Operation\Aggregate( $collection->getDatabaseName(), $collection->getCollectionName(), $pipeline ); $result = $collection->explain($aggregate); echo json_encode($result), PHP_EOL;
{"explainVersion":"2","queryPlanner":{"namespace":"sample_restaurants.restaurants", "indexFilterSet":false,"parsedQuery":{"cuisine":{"$eq":"Bakery"}},"queryHash":"865F14C3", "planCacheKey":"D56D6F10","optimizedPipeline":true,"maxIndexedOrSolutionsReached":false, "maxIndexedAndSolutionsReached":false,"maxScansToExplodeReached":false,"winningPlan":{ ... }
추가 정보
MongoDB PHP 라이브러리를 사용하여 복잡한 집계 파이프라인을 생성하는 튜토리얼을 보려면 MongoDB 개발자 센터에서 바닐라 PHP 및 MongoDB 를 사용한 복잡한 집계 파이프 라인을 참조하세요.
MongoDB Server 매뉴얼
이 가이드 에서 설명하는 주제에 대해 학습 보려면 MongoDB Server 매뉴얼의 다음 페이지를 참조하세요.
표현식 연산자의 전체 목록을 보려면 애그리게이션 연산자를 참조하세요.
집계 파이프라인 을 어셈블하는 방법과 예제를 학습 집계 파이프라인을 참조하세요.
파이프라인 단계 생성에 대해 자세히 알아보려면 애그리게이션 단계를 참조하세요.
MongoDB 작업에 대해 자세히 알아보려면 출력 설명 및 쿼리 계획을 참조하세요.
API 문서
이 가이드 에서 설명하는 메서드에 대해 학습 보려면 다음 API 설명서를 참조하세요.