Menu Docs
Página inicial do Docs
/ / /
Driver Rust
/

GridFS

Nesta página

  • Visão geral
  • Como funciona o GridFS
  • Referenciar um bucket do GridFS
  • Fazer upload de arquivos
  • Baixar arquivos
  • Recuperar informações do arquivo
  • Renomear arquivos
  • Excluir arquivos
  • Excluir um bucket do GridFS
  • Informações adicionais
  • Documentação da API

Neste guia, você aprenderá como armazenar e recuperar arquivos grandes no MongoDB usando o GridFS. O GridFS é uma especificação que descreve como fazer a divisão dos arquivos em parte durante o armazenamento e remontá-los durante a recuperação. A implementação do driver Rust do GridFS managed as operações e organização do armazenamento de arquivos.

Use o GridFS se o tamanho do arquivo exceder o limite de tamanho do documento BSON de 16 MB. O GridFS também ajuda a acessar arquivos sem carregar todo o arquivo na memória. Para obter informações mais detalhadas sobre se o GridFS é adequado para seu caso de uso, consulte a página GridFS no manual do servidor MongoDB.

Para saber mais sobre o GridFS, navegue até as seguintes seções deste guia:

O GridFS organiza os arquivos em um bucket, que é um grupo de collection do MongoDB que contêm parte de arquivos e informações descritivas. Os buckets contêm as seguintes collection, nomeadas de acordo com a convenção definida na especificação GridFS:

  • chunks, que armazena as partes de arquivos binários

  • files, que armazena os metadados do arquivo

Quando você cria um novo bucket GridFS, o driver Rust executa as seguintes ações:

  • Cria a collection chunks e files , prefixadas com o nome de bloco padrão fs, a menos que você especifique um nome diferente

  • Cria um índice em cada collection para garantir a recuperação eficiente de arquivos e metadados relacionados

Você pode criar uma referência a um bucket GridFS seguindo as etapas na seção Referenciar um bucket GridFS desta página. No entanto, o driver não cria um novo bucket GridFS e seus índices até a primeira operação de gravação. Para obter mais informações sobre os índices do GridFS, consulte a página Índices do GridFS no manual do servidor MongoDB.

Ao armazenar um arquivo em um contêiner GridFS, o driver Rust cria os seguintes documentos:

  • Um documento na coleção files que armazena um ID de arquivo exclusivo, nome de arquivo e outros metadados de arquivo

  • Um ou mais documento na collection chunks que armazenam o conteúdo do arquivo, que o driver faz a divisão em partes menores

O diagrama a seguir descreve como o GridFS divide os arquivos ao fazer upload para um bucket:

Um diagrama que mostra como o GridFS carrega um arquivo em um bloco

Ao recuperar arquivos, o GridFS obtém os metadados da coleção files no contêiner especificado e utiliza as informações para reconstruir o arquivo a partir de documentos na coleção chunks. Você pode ler o arquivo na memória ou enviá-lo para um fluxo.

Antes de armazenar arquivos em um contêiner GridFS, crie uma referência de contêiner ou obtenha uma referência para um contêiner existente.

O exemplo a seguir chama o método gridfs_bucket() em um reconhecimento de data center, que cria uma referência a um GridFS novo ou existente:

let bucket = my_db.gridfs_bucket(None);

Você pode especificar um nome de bucket personalizado configurando o campo bucket_name da estrutura GridFsBucketOptions .

Observação

Instanciação de estruturas

O driver Rust implementa o padrão de design Builder para a criação de alguns tipos de estruturas, incluindo GridFsBucketOptions. Você pode usar o método builder() para construir uma instância de cada tipo encadeando métodos de construtor de opção.

A tabela seguinte descreve os métodos que você pode utilizar para configurar campos do GridFsBucketOptions :

Método
Valores possíveis
Descrição
bucket_name()
Any String value
Specifies a bucket name, which is set to fs by default

chunk_size_bytes()

Qualquer valor u32

Especifica o tamanho da parte usado para dividir o arquivo em partes, que é de 255 KB por padrão

write_concern()
WriteConcern::w(),
WriteConcern::w_timeout(),
WriteConcern::journal(),
WriteConcern::majority()
Specifies the bucket's write concern, which is set to the database's write concern by default

read_concern()

ReadConcern::local(), ReadConcern::majority(), ReadConcern::linearizable(), ReadConcern::available(), ReadConcern::snapshot()

Especifica a referência de leitura do bucket, que é definida como a referência de leitura do reconhecimento de data center por padrão

selection_criteria()
SelectionCriteria::ReadPreference,
SelectionCriteria::Predicate
Specifies which servers are suitable for a bucket operation, which is set to the database's selection
criteria by default

O exemplo a seguir especifica opções em uma instância GridFsBucketOptions para configurar um nome de bucket personalizado e um limite de tempo de cinco segundos para operações de gravação:

let wc = WriteConcern::builder().w_timeout(Duration::new(5, 0)).build();
let opts = GridFsBucketOptions::builder()
.bucket_name("my_bucket".to_string())
.write_concern(wc)
.build();
let bucket_with_opts = my_db.gridfs_bucket(opts);

Você pode carregar um arquivo em um contêiner GridFS abrindo um fluxo de carregamento e gravando seu arquivo no fluxo. Chame o método open_upload_stream() na instância do bucket para abrir o stream. Este método retorna uma instância do GridFsUploadStream para a qual você pode escrever o conteúdo do arquivo. Para carregar o conteúdo do arquivo para GridFsUploadStream, chame o método write_all() e passe os bytes do arquivo como parâmetro.

Dica

Importar o módulo necessário

O struct GridFsUploadStream implementa a característica futures_io::AsyncWrite. Para usar os métodos de gravação AsyncWrite , como write_all(), importe o módulo AsyncWriteExt para o arquivo de aplicativo com a seguinte declaração de uso:

use futures_util::io::AsyncWriteExt;

O exemplo a seguir usa um fluxo de upload para carregar um arquivo chamado "example.txt" em um bucket GridFS:

let bucket = my_db.gridfs_bucket(None);
let file_bytes = fs::read("example.txt").await?;
let mut upload_stream = bucket.open_upload_stream("example").await?;
upload_stream.write_all(&file_bytes[..]).await?;
println!("Document uploaded with ID: {}", upload_stream.id());
upload_stream.close().await?;

Você pode baixar um arquivo de um contêiner GridFS abrindo um fluxo de download e lendo o fluxo. Chame o método open_download_stream() na sua instância de bucket, especificando o valor _id do arquivo desejado como parâmetro. Este método retorna uma instância GridFsDownloadStream da qual você pode acessar o arquivo. Para ler o arquivo do GridFsDownloadStream, chame o método read_to_end() e passe um vetor como parâmetro.

Dica

Importar o módulo necessário

A estrutura GridFsDownloadStream implementa a funcionalidade futures_io::AsyncRead . Para usar os métodos de leitura AsyncRead , como read_to_end(), importe o módulo AsyncReadExt para o arquivo do aplicativo com a seguinte declaração de uso:

use futures_util::io::AsyncReadExt;

O exemplo a seguir usa um fluxo de downloads para baixar um arquivo com um valor _id de 3289 de um bucket GridFS:

let bucket = my_db.gridfs_bucket(None);
let id = ObjectId::from_str("3289").expect("Could not convert to ObjectId");
let mut buf = Vec::new();
let mut download_stream = bucket.open_download_stream(Bson::ObjectId(id)).await?;
let result = download_stream.read_to_end(&mut buf).await?;
println!("{:?}", result);

Observação

A API de streaming do GridFS não pode carregar partes parciais. Quando um fluxo de download precisa extrair uma parte do MongoDB, ele puxa toda a parte para a memória. O tamanho padrão da parte de 255 KB geralmente é suficiente, mas você pode reduzir o tamanho da parte para reduzir a sobrecarga de memória.

Você pode recuperar informações sobre os arquivos armazenados na coleção files do bucket GridFS. Cada arquivo é armazenado como uma instância do tipo FilesCollectionDocument, contendo os seguintes campos que representam as informações do arquivo:

  • _id: o ID do arquivo

  • length: o tamanho do arquivo

  • chunk_size_bytes: o tamanho das partes do arquivo

  • upload_date: a data e hora de upload do arquivo

  • filename: o nome do arquivo

  • metadata: um documento que armazena metadados especificados pelo usuário

Ligue para o método find() em uma instância de bucket GridFS para recuperar arquivos do bucket. O método retorna uma instância do cursor da qual você pode acessar os resultados.

O exemplo a seguir recupera e imprime o comprimento de cada arquivo em um contêiner GridFS:

let bucket = my_db.gridfs_bucket(None);
let filter = doc! {};
let mut cursor = bucket.find(filter).await?;
while let Some(result) = cursor.try_next().await? {
println!("File length: {}\n", result.length);
};

Dica

Para saber mais sobre o método find() , consulte o guia Recuperar dados . Para saber mais sobre como recuperar dados de um cursor, consulte o guia Acessar dados usando um cursor .

Você pode atualizar o nome de um arquivo GridFS em seu bucket ligando para o método rename() em uma instância de bucket. Passe o valor _id do arquivo de destino e o novo nome do arquivo como parâmetros para o método rename() .

Observação

O método rename() suporta somente a atualização do nome de um arquivo de cada vez. Para renomear vários arquivos, recupere uma lista de arquivos correspondentes ao nome do arquivo do contêiner, extraia o campo _id dos arquivos que você deseja renomear e passe cada valor em chamadas separadas para o método rename().

O exemplo a seguir atualiza o campo filename do arquivo contendo um valor _id de 3289 para "new_file_name":

let bucket = my_db.gridfs_bucket(None);
let id = ObjectId::from_str("3289").expect("Could not convert to ObjectId");
let new_name = "new_file_name";
bucket.rename(Bson::ObjectId(id), new_name).await?;

Você pode usar o método delete() para remover um arquivo do seu bucket. Para remover um arquivo, chame delete() na instância do bucket e passe o valor _id do arquivo como parâmetro.

Observação

O método delete() suporta apenas a exclusão de um arquivo por vez. Para excluir vários arquivos, recupere os arquivos do bucket, extraia o campo _id dos arquivos que deseja excluir e passe cada valor _id em chamadas separadas para o método delete() .

O exemplo a seguir exclui o arquivo no qual o valor do campo _id é 3289:

let bucket = my_db.gridfs_bucket(None);
let id = ObjectId::from_str("3289").expect("Could not convert to ObjectId");
bucket.delete(Bson::ObjectId(id)).await?;

Você pode usar o método drop() para excluir um bucket, que remove a collection files e chunks de um bucket. Para excluir o bucket, ligue para drop() na sua instância do bucket.

O exemplo a seguir exclui um bucket GridFS:

let bucket = my_db.gridfs_bucket(None);
bucket.drop().await?;

Para saber mais sobre qualquer um dos métodos ou tipos mencionados neste guia, consulte a seguinte documentação da API:

Voltar

Pesquisar geoespacialmente