Menu Docs
Página inicial do Docs
/ / /
Node.js
/

GridFS

Nesta página

  • Visão geral
  • Como funciona o GridFS
  • Crie um intervalo GridFS
  • Fazer upload de arquivos
  • Recuperar informações do arquivo
  • Baixar arquivos
  • Renomear arquivos
  • Excluir arquivos
  • Excluir um bucket do GridFS
  • Recursos adicionais

Neste guia, você pode aprender como armazenar e recuperar arquivos grandes no MongoDB usando o GridFS. O GridFS é uma especificação que descreve como dividir os arquivos em partes durante o armazenamento e remontá-los durante a recuperação. A implementação do driver GridFS gerencia as operações e organização do armazenamento de arquivos.

Você deve usar GridFS se o tamanho do arquivo exceder o limite de tamanho do documento BSON de 16 megabytes. Para obter informações mais detalhadas sobre se o GridFS é adequado para seu caso de uso, consulte a página de manual do servidor GridFS.

Navegue pelas seções a seguir para saber mais sobre as operações e a implementação do GridFS:

O GridFS organiza os arquivos em um bucket, um grupo de coleções do MongoDB que contém os blocos de arquivos e as informações descritivas. Os buckets contêm as seguintes coleções, nomeadas usando a convenção definida na especificação GridFS:

  • A coleção chunks armazena os blocos de arquivo binário.

  • A coleção files armazena os metadados do arquivo.

Quando você cria um novo bloco GridFS, o driver cria as collections chunks e files , prefixadas com o nome de bloco padrão fs, a menos que você especifique um nome diferente. O driver também cria um índice em cada coleção para garantir a recuperação eficiente de arquivos e metadados relacionados. O driver só cria o bloco GridFS na primeira operação de escrita se ele ainda não existir. O driver só cria índices se eles não existirem e quando o bloco estiver vazio. Para obter mais informações sobre os índices do GridFS, consulte a página do manual do servidor sobre Índices do GridFS.

Ao armazenar arquivos com GridFS, o driver divide os arquivos em partes menores, cada um representado por um documento separado na coleção do chunks. Ele também cria um documento na coleção files que contém um ID de arquivo exclusivo, um nome de arquivo e outros metadados de arquivo. Você pode fazer upload do arquivo da memória ou de um stream. O diagrama a seguir descreve como o GridFS divide os arquivos ao fazer upload para um bucket:

Um diagrama que mostra como o GridFS carrega um arquivo em um bloco

Ao recuperar arquivos, o GridFS obtém os metadados da coleção files no contêiner especificado e utiliza as informações para reconstruir o arquivo a partir de documentos na coleção chunks. Você pode ler o arquivo na memória ou enviá-lo para um fluxo.

Crie um bucket ou obtenha uma referência a um existente para começar a armazenar ou recuperar arquivos do GridFS. Crie uma instância GridFSBucket , passando um banco de dados como parâmetro. Você pode então usar a instância GridFSBucket para chamar operações de leitura e gravação nos arquivos do seu bucket:

const db = client.db(dbName);
const bucket = new mongodb.GridFSBucket(db);

Passe o nome do bloco como o segundo parâmetro para o método create() para criar ou fazer referência a um bloco com um nome personalizado diferente do nome padrão fs, conforme mostrado no exemplo a seguir:

const bucket = new mongodb.GridFSBucket(db, { bucketName: 'myCustomBucket' });

Para obter mais informações, consulte a documentação da API do GridFSBucket.

Use o método openUploadStream() de GridFSBucket para criar um fluxo de upload para um determinado nome de arquivo. Você pode usar o método pipe() para conectar um fluxo de leitura fs do Node.js ao fluxo de upload. O método openUploadStream() permite que você especifique informações de configuração, como o tamanho do bloco do arquivo e outros pares de campo/valor a serem armazenados como metadados. Defina essas opções como parâmetros de openUploadStream() conforme mostrado no seguinte snippet de código:

fs.createReadStream('./myFile').
pipe(bucket.openUploadStream('myFile', {
chunkSizeBytes: 1048576,
metadata: { field: 'myField', value: 'myValue' }
}));

Consulte a documentação da API para openUploadStream() para obter mais informações.

Nesta seção, você pode aprender como recuperar metadados de arquivo armazenados na coleção files do contêiner GridFS. Os metadados contêm informações sobre o arquivo a que se refere, incluindo:

  • O _id do arquivo

  • O nome do arquivo

  • O tamanho/comprimento do arquivo

  • A data e a hora do carregamento

  • Um documento metadata no qual você pode armazenar qualquer outra informação

Ligue para o método find() na instância do GridFSBucket para recuperar arquivos de um bucket GridFS. O método retorna uma instância do FindCursor da qual você pode acessar os resultados.

O exemplo de código a seguir mostra como recuperar e imprimir metadados de arquivos de todos os seus arquivos em um bucket do GridFS. Entre as diferentes maneiras de percorrer os resultados recuperados do iterável FindCursor, o exemplo a seguir usa a sintaxe for await...of para exibir os resultados:

const cursor = bucket.find({});
for await (const doc of cursor) {
console.log(doc);
}

O método find() aceita várias especificações de consulta e pode ser combinado com outros métodos como sort(), limit() e project().

Para obter mais informações sobre as classes e métodos mencionados nesta seção, consulte os seguintes recursos:

Você pode baixar arquivos do seu banco de dados MongoDB utilizando o método openDownloadStreamByName() do GridFSBucket para criar um stream de download.

O exemplo a seguir mostra como fazer o download de um arquivo referenciado pelo nome do arquivo, armazenado no campo filename, para o seu diretório de trabalho:

bucket.openDownloadStreamByName('myFile').
pipe(fs.createWriteStream('./outputFile'));

Observação

Se houver vários documentos com o mesmo valor de filename, o GridFS transmitirá o arquivo mais recente com o nome fornecido (conforme determinado pelo campo uploadDate).

Alternativamente, você pode utilizar o método openDownloadStream(), que utiliza o campo _id de um arquivo como um parâmetro:

bucket.openDownloadStream(ObjectId("60edece5e06275bf0463aaf3")).
pipe(fs.createWriteStream('./outputFile'));

Observação

A API de streaming do GridFS não pode carregar blocos parciais. Quando um fluxo de download precisa extrair um bloco do MongoDB, ele puxa todo o bloco para a memória. O tamanho padrão do bloco de 255 kilobytes geralmente é suficiente, mas você pode reduzir o tamanho do bloco para reduzir a sobrecarga de memória.

Para obter mais informações sobre o método openDownloadStreamByName(), consulte a documentação da API.

Utilize o método rename() para atualizar o nome de um arquivo GridFS em seu bucket. Você deve especificar o arquivo para renomear pelo campo _id em vez do nome do arquivo.

Observação

O método rename() suporta somente a atualização do nome de um arquivo de cada vez. Para renomear vários arquivos, recupere uma lista de arquivos correspondentes ao nome do arquivo do contêiner, extraia o campo _id dos arquivos que você deseja renomear e passe cada valor em chamadas separadas para o método rename().

O exemplo a seguir mostra como atualizar o campo filename para "newFileName" fazendo referência ao campo _id de um documento:

bucket.rename(ObjectId("60edece5e06275bf0463aaf3"), "newFileName");

Para obter mais informações sobre este método, consulte a documentação da API renomear().

Use o método delete() para remover um arquivo do seu bucket. Você deve especificar o arquivo pelo campo _id em vez do nome do arquivo.

Observação

O método delete() suporta apenas a exclusão de um arquivo por vez. Para excluir vários arquivos, recupere os arquivos do bucket, extraia o campo _id dos arquivos que deseja excluir e passe cada valor em chamadas separadas para o método delete().

O seguinte exemplo mostra como excluir um arquivo referenciando seu campo _id:

bucket.delete(ObjectId("60edece5e06275bf0463aaf3"));

Para obter mais informações sobre esse método, consulte a documentação da API para delete().

Utilize o método drop() para remover as coleções files e chunks de um bucket, que efetivamente exclui o bucket. O seguinte exemplo de código mostra como excluir um bucket GridFS:

bucket.drop();

Para obter mais informações sobre esse método, consulte a documentação da API para drop().

← Monitoramento de pool de conexões