GridFS 사용하여 대용량 파일 저장

이 페이지의 내용

개요

GridFS 작동 방식
GridFS 버킷 만들기
파일 업로드
파일 정보 검색
파일 다운로드
파일 이름 바꾸기
파일 삭제
API 문서

개요

이 가이드 에서는 GridFS 사용하여 MongoDB 에 대용량 파일을 저장 하고 조회 방법을 학습 수 있습니다. GridFS 는 파일을 저장할 때 청크로 분할 하고 검색할 때 다시 조립하는 방법을 설명합니다. 스칼라 드라이버의 GridFS 구현 파일 저장 의 운영 및 조직 관리하는 추상화입니다.

파일 크기가 BSON 문서 크기 제한인 16MB를 초과하는 경우 GridFS 를 사용하세요. GridFS 가 사용 사례 에 적합한지 여부에 대한 자세한 내용은 MongoDB Server 매뉴얼에서 GridFS 를 참조하세요.

다음 섹션에서는 GridFS 작업과 이를 수행하는 방법을 설명합니다.

GridFS 작동 방식

GridFS는 파일 청크와 파일을 설명하는 정보가 들어 있는 MongoDB 컬렉션 그룹인 버킷에 파일을 구성합니다. 버킷에는 GridFS 사양에 정의된 규칙을 사용하여 명명된 다음 컬렉션이 포함되어 있습니다.

chunks 컬렉션은 바이너리 파일 청크를 저장합니다.
files 0} 컬렉션에 파일 메타데이터가 저장됩니다.

새 GridFS 버킷을 생성할 때 생성자에 fs.chunks fs.files 다른 이름을 지정하지 않는 GridFSBucket() 한 운전자 및 컬렉션을 생성합니다. 또한 운전자 파일 및 관련 메타데이터 를 효율적으로 검색할 수 있도록 각 컬렉션 에 인덱스 생성합니다. 운전자 GridFS 버킷을 생성하며, 버킷이 존재하지 않는 경우 첫 번째 쓰기 (write) 작업이 수행될 때만 생성합니다. 운전자 인덱스가 존재하지 않고 버킷이 비어 있는 경우에만 인덱스를 생성합니다.GridFS 인덱스에 대한 자세한 내용은 MongoDB Server 매뉴얼에서 GridFS 인덱스를 참조하세요.

GridFS로 파일을 저장할 때 드라이버는 파일을 작은 청크로 분할하며, 각각의 청크는 chunks 컬렉션에서 별도의 문서로 표시됩니다. 또한 files 컬렉션에 파일 ID, 파일 이름 및 기타 파일 메타데이터가 포함된 문서를 만듭니다. 메모리 또는 스트림에서 파일을 업로드할 수 있습니다. 버킷에 업로드할 때 GridFS가 파일을 분할하는 방법을 보려면 다음 다이어그램을 참조하세요.

GridFS가 파일을 버킷에 업로드하는 방법을 보여주는 다이어그램입니다.

파일을 검색할 때 GridFS는 지정된 버킷의 files 컬렉션에서 메타데이터를 가져와서 이 정보를 사용하여 chunks 컬렉션의 문서에서 파일을 재구성합니다. 파일을 메모리로 읽거나 스트림으로 출력할 수 있습니다.

GridFS 버킷 만들기

GridFS에서 파일을 저장하거나 검색하려면 GridFSBucket() 생성자를 호출하고 MongoDatabase 인스턴스를 전달하여 GridFS 버킷을 만듭니다. GridFSBucket 인스턴스를 사용하여 버킷의 파일에 대한 읽기 및 쓰기 작업을 호출할 수 있습니다.

val bucket = GridFSBucket(database)

기본값 이름 fs 이외의 사용자 지정 이름으로 버킷을 만들거나 참조하려면 다음 예시 와 같이 버킷 이름을 GridFSBucket() 생성자에 두 번째 매개 변수로 전달합니다.

val filesBucket = GridFSBucket(database, "files")

파일 업로드

GridFSBucket.uploadFromObservable() 메서드는 Observable[ByteBuffer] 의 내용을 읽고 이를 GridFSBucket 인스턴스 에 저장합니다.

GridFSUploadOptions 유형을 사용하여 청크 크기를 구성하거나 추가 메타데이터를 포함할 수 있습니다.

다음 예시 Observable[ByteBuffer] 의 내용을 GridFSBucket에 업로드합니다.

// Get the input stream
val observableToUploadFrom = Observable(
  Seq(ByteBuffer.wrap("MongoDB Tutorial".getBytes(StandardCharsets.UTF_8)))
)
// Create some custom options
val options = new GridFSUploadOptions()
  .chunkSizeBytes(358400)
  .metadata(Document("type" -> "presentation"))
// Upload the file
val fileIdObservable = filesBucket.uploadFromObservable("mongodb-tutorial", observableToUploadFrom, options)
val fileId = Await.result(fileIdObservable.toFuture(), Duration(10, TimeUnit.SECONDS))
println(s"File uploaded with id: ${fileId.toHexString}")

파일 정보 검색

이 섹션에서는 GridFS 버킷의 files 컬렉션에 저장된 파일 메타데이터를 검색하는 방법을 알아볼 수 있습니다. 메타데이터에는 다음을 포함하여 참조하는 파일에 대한 정보가 포함됩니다.

파일의 _id입니다.
파일 이름
파일의 길이/크기
업로드 날짜 및 시간
다른 정보를 저장할 수 있는 metadata 문서입니다.

컬렉션 에서 조회 할 수 있는 필드에 files 대해 자세히 학습 MongoDB Server 매뉴얼의 GridFS 파일 컬렉션 문서를 참조하세요.

GridFS 버킷에서 파일을 조회 하려면 GridFSBucket 인스턴스 에서 find() 메서드를 호출합니다. 다음 코드 예시 GridFS 버킷의 모든 파일에서 파일 메타데이터 검색하고 출력합니다.

val filesObservable = filesBucket.find()
val results = Await.result(filesObservable.toFuture(), Duration(10, TimeUnit.SECONDS))
results.foreach(file => println(s" - ${file.getFilename}"))

MongoDB 쿼리에 대해 자세히 학습 데이터 조회를 참조하세요.

파일 다운로드

downloadToObservable() 메서드는 MongoDB 에서 콘텐츠를 읽는 Observable[ByteBuffer] 을 반환합니다.

파일을 기준으로 _id 파일을 다운로드하려면 _id 을 메서드에 전달합니다. 다음 예제에서는 _id 파일별로 파일을 다운로드합니다.

val downloadObservable = filesBucket.downloadToObservable("<example file ID>")
val downloadById = Await.result(downloadObservable.toFuture(), Duration(10, TimeUnit.SECONDS))

파일 의 _id 는 몰라도 파일 이름은 알고 있는 경우 파일 이름을 downloadToObservable() 메서드에 전달할 수 있습니다. 다음 예시 mongodb-tutorial라는 파일 다운로드합니다.

val downloadObservable = filesBucket.downloadToObservable("mongodb-tutorial")
val downloadById = Await.result(downloadObservable.toFuture(), Duration(10, TimeUnit.SECONDS))

참고

동일한 filename 값을 가진 문서가 여러 개 있는 경우 GridFS 지정된 이름( uploadDate 필드 에 따라 결정됨)을 가진 가장 최근 파일 가져옵니다.

파일 이름 바꾸기

rename() 메서드를 사용하여 버킷에 있는 GridFS 파일의 이름을 업데이트합니다. 파일 이름이 아닌 _id 필드로 이름을 바꾸도록 파일을 지정해야 합니다.

다음 예에서는 파일 이름을 mongodbTutorial으로 변경합니다.

val renameObservable = filesBucket.rename("<example file ID>", "mongodbTutorial")
Await.result(renameObservable.toFuture(), Duration(10, TimeUnit.SECONDS))

참고

rename() 메서드는 한 번에 하나의 파일 이름 업데이트만 지원합니다. 여러 파일의 이름을 바꾸려면 버킷에서 파일 이름과 일치하는 파일 목록을 검색하고, 이름을 바꾸려는 파일에서 _id 필드를 추출한 다음 rename() 메서드에 각 값을 개별적으로 호출하여 전달합니다.

파일 삭제

버킷에서 파일의 컬렉션 문서 와 관련 청크를 제거 하려면 delete() 메서드를 사용합니다. 파일 이름이 아닌 _id 필드 로 파일 지정해야 합니다.

다음 예시 _id을 기준으로 파일 삭제합니다.

val deleteObservable = filesBucket.delete("<example file ID>")
Await.result(deleteObservable.toFuture(), Duration(10, TimeUnit.SECONDS))

참고

delete() 메서드는 한 번에 하나의 파일 삭제만 지원합니다. 여러 파일을 삭제하려면 버킷에서 파일을 검색하고 삭제하려는 파일에서 _id 필드를 추출한 다음 delete() 메서드에 각 값을 개별적으로 호출하여 전달합니다.

API 문서

GridFS 사용하여 대용량 파일을 저장 하고 조회 에 대해 자세히 학습 다음 API 설명서를 참조하세요.

GridFSBucket

돌아가기

트랜잭션

복제본 세트에 대한 작업