mongodb:是乙個資料庫 ,高效能、無模式、文件性,目前nosql中最熱門的資料庫,開源產品,基於c++開發。是nosql資料庫中功能最豐富,最像關聯式資料庫的。
1.儲存結構:
乙個資料庫有多個集合,乙個集合有多個文件;
2.儲存形式:
3.目錄結構:
資料庫服務(mongod)
分片集群部署中,資料和查詢的路由服務(mongos)
shell客戶端(mongo)
匯入匯出工具(mongoimport / mongoexport)
備份恢復工具(mongodump / mongorestore)
拉取並重放oplog的工具(mongooplog)
監控工具(mongostat、mongotop、mongosniff)
gridfs的命令列操作工具(mongofiles)
效能測試工具(mongoperf,暫時只能測i/o)
檢視bson檔案的工具(bsondump)
其中最主要的程式是mongod(資料庫服務),mongod在不同的部署方案中(單機部署,副本集部署,分片集群部署),通過不同的配置,可以扮演多種不同的角色:
4.資料儲存:
mongodb有三種主要的資料檔案:
journal(日誌檔案):mongodb只是用來處理在系統出現宕機的時候恢復尚未同步到磁碟上的記憶體資料。啟動mongodb的時候缺省會建立三個為1g的日誌檔案;
namespace(表名檔案):dbname.ns, 用來儲存整個資料庫的集合以及索引的名字。這個檔案不大,預設16m,可以儲存24000個集合或者索引名以及那些集合和索引在資料檔案中得具體位置。通過這個檔案mongodb可以知道從**去開始尋找或插入集合的資料或者索引資料。這個值可以通過引數調整至2g。
data(資料以及檢索檔案):mongodb的資料以及索引都存放在乙個或者多個mongodb資料檔案裡。第乙個資料檔案會以「資料庫名.0」命名,如 my-db.0。這個檔案預設大小是64m,在接近用完這個64m之前,mongodb 會提前生成下乙個資料檔案如my-db.1。資料檔案的大小會2倍遞增。第二個資料檔案的大小為128m,第三個為256m。一直到了2g以後就會停止,一直按這個2g這個大小增加新的檔案(新版本才是)。
MongoDB基本概念掃瞄
1 非預定義模式,可根據需要新增和刪除字段 2 橫向擴充套件 3 自動處理跨集群的資料和負載 4 自動重新分配文件 1 索引 唯一索引,復合索引,地理空間索引,全文索引 2 聚合 3 特殊的集合型別 時間有限集合 大小固定集合 4 檔案儲存 1 命名規範 滿足下列條件的任意utf 8字串 1.1 不...
MongoDB 基礎篇(一) 基本概念
mongodb是乙個基於分布式檔案儲存的資料庫。由c 語言編寫。旨在為web應用提供可擴充套件的高效能資料儲存解決方案。mongodb是乙個介於關聯式資料庫和非關聯式資料庫之間的產品,是非關聯式資料庫當中功能最豐富,最像關聯式資料庫的。它支援的資料結構非常鬆散,是類似json的bson格式,因此可以...
TF IDF基本概念以及例題
idf inverse document frequency 逆文件頻率。說人話,也就是出現頻率高的詞可能是一些過於常用的詞,例如 的 是 我 如果僅僅根據tf來作為衡量指標,那麼結果會沒有意義,所以我們需要設定idf這個指標,它的大小與乙個詞的常見程度成反比。根據路透社的806791份文件中 ca...