MongoDB GridFS


GridFS是用于存储和检索大文件(例如图像,音频文件,视频文件等)的MongoDB规范。它是一种用于存储文件的文件系统,但其数据存储在MongoDB集合中。 GridFS能够存储甚至超过其文档大小限制16MB的文件。

GridFS将文件分成多个块,并将每个数据块存储在单独的文档中,每个文件的最大大小为255k。

GridFS默认使用两个集合fs.filesfs.chunks存储文件的元数据和块。每个块均由其唯一的_id ObjectId字段标识, fs.files用作父文档,files_idfs.chunks文档中的字段将块链接到其父级。

以下是fs.files集合的样本文件:

{
    "filename": "test.txt",
    "chunkSize": NumberInt(261120),
    "uploadDate": ISODate("2014-04-13T11:32:33.557Z"),
    "md5": "7b762939321e146569b07f72c62cca4f",
    "length": NumberInt(646)
}

该文档指定文件名,块大小,上载日期和长度。

以下是fs.chunks文件的样本文件:

{
    "files_id": ObjectId("534a75d19f54bfec8a2fe44b"),
    "n": NumberInt(0),
    "data": "Mongo Binary Data"
}

将文件添加到GridFS


现在,我们将使用put命令。为此,我们将使用mongofiles.exe该实用程序位于MongoDB安装文件夹的bin文件夹中。

打开命令提示符,导航到MongoDB安装文件夹的bin文件夹中的mongofiles.exe,然后键入以下代码:

>mongofiles.exe -d gridfs put song.mp3

gridfs是将在其中存储文件的数据库的名称。如果数据库不存在,MongoDB将自动动态创建一个新文档。 Song.mp3是上载文件的名称。要查看数据库中文件的文档,可以使用查找查询:

>db.fs.files.find()

上面的命令返回了以下文件:

{
    _id: ObjectId('534a811bf8b4aa4d33fdf94d'),
    filename: "song.mp3",
    chunkSize: 261120,
    uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41",
    length: 10401959
}

我们还可以使用上一查询中返回的文档ID,通过以下代码查看fs.chunks集合中与存储文件相关的所有块:

>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})

就我而言,该查询返回了40个文档,这意味着整个mp3文档被分为40个数据块。