今天跟大家分享一下mongodb中比較好玩的知識,主要包括:聚合,游標。
一: 聚合
常見的聚合操作跟sql server一樣,有:count,distinct,group,mapreduce。
<1> count
count是最簡單,最容易,也是最常用的聚合工具,它的使用跟我們c#裡面的count使用簡直一模一樣。
這個操作相信大家也是非常熟悉的,指定了誰,誰就不能重複,直接上圖。
在mongodb裡面做group操作有點小複雜,不過大家對sql server裡面的group比較熟悉的話還是一眼能看的明白的,其實group操作本質上形成了一種「k-v」模型,就像c#中的dictionary,好,有了這種思維,我們來看看如何使用group。
下面舉的例子就是按照age進行group操作,value為對應age的姓名。下面對這些引數介紹一下:
key: 這個就是分組的key,我們這裡是對年齡分組。
initial: 每組都分享乙個」初始化函式「,特別注意:是每一組,比如這個的age=20的value的list分享乙個initial函式,age=22同樣也分享乙個initial函式。
$reduce: 這個函式的第乙個引數是當前的文件物件,第二個引數是上一次function操作的累計物件,第一次為initial中的。有多少個文件, $reduce就會呼叫多少次。
看到上面的結果,是不是有點感覺,我們通過age檢視到了相應的name人員,不過有時我們可能有如下的要求:
①:想過濾掉age>25一些人員。
②:有時person陣列裡面的人員太多,我想加上乙個count屬性標明一下。
針對上面的需求,在group裡面還是很好辦到的,因為group有這麼兩個可選引數: condition 和 finalize。
condition: 這個就是過濾條件。
finalize:這是個函式,每一組文件執行完後,多會觸發此方法,那麼在每組集合裡面加上count也就是它的活了。
這玩意算是聚合函式中最複雜的了,不過複雜也好,越複雜就越靈活。mapreduce其實是一種程式設計模型,用在分布式計算中,其中有乙個「map」函式,乙個」reduce「函式。
① map:
這個稱為對映函式,裡面會呼叫emit(key,value),集合會按照你指定的key進行對映分組。
② reduce:
這個稱為簡化函式,會對map分組後的資料進行分組簡化,注意:在reduce(key,value)中的key就是emit中的key,vlaue為emit分組後的emit(value)的集合,這裡也就是很多的陣列。
③ mapreduce:
這個就是最後執行的函式了,引數為map,reduce和一些可選引數。具體看圖可知:
從圖中我們可以看到如下資訊:
result: "存放的集合名「;
input:傳入文件的個數。
emit:此函式被呼叫的次數。
reduce:此函式被呼叫的次數。
output:最後返回文件的個數。
最後我們看一下「collecton」集合裡面按姓名分組的情況。
二:游標
mongodb裡面的游標有點類似我們說的c#裡面延遲執行,比如:
var list=db.person.find();
針對這樣的操作,list其實並沒有獲取到person中的文件,而是申明乙個「查詢結構」,等我們需要的時候通過for或者next()一次性載入過來,然後讓游標逐行讀取,當我們列舉完了之後,游標銷毀,之後我們在通過list獲取時,發現沒有資料返回了。
當然我們的「查詢構造」還可以搞的複雜點,比如分頁,排序都可以加進去。
var single=db.person.find().sort().skip(2).limit(2);
那麼這樣的「查詢構造」可以在我們需要執行的時候執行,大大提高了不必要的花銷。
MongoDB之三(高階操作 聚合 游標)
一 聚合 常見的聚合操作跟sql server一樣,有 count,distinct,group,mapreduce。1 count count是最簡單,最容易,也是最常用的聚合工具,它的使用跟我們c 裡面的count使用簡直一模一樣 這個操作相信大家也是非常熟悉的,指定了誰,誰就不能重複,直接上圖...
mongodb 聚合管道
mongodb聚合管道由多個階段組成。每個階段在文件通過管道時轉換文件。管道階段不需要為每個輸入文件生成乙個輸出文件 例如,有些階段可能會生成新的文件或過濾掉文件。管道階段可以在管道 現多次,但 out merge和 geonear階段除外。有關所有可用階段的列表,請參見聚合管道階段。mongodb...
mongodb中的聚合
mongodb提供三種方式來實現聚合 聚合管道,map reduce,及單一目的的聚合方法。管道操作可以在分片的集合上運算,可以使用索引來提高效率,管道使用了mongodb內部的操作來進行高效資料聚合,是聚合操作的首選。tch sort操作出現在管道的開始位置時候可以使用索引。在3.2開始索引可以覆...