迭代計算的一些開源框架

迭代計算是一種通過多次迴圈得出結果的計算方式，一般需要將上一次計算的結果代入到下一步的計算中去。當計算資料和計算規模都比較小時，可以在單機上實現計算過程；但是當資料集變大或者計算複雜度上公升時，在單機上就可能無法完成計算了。在網際網路企業中，各種資料探勘，資訊檢索等計算用例，由於抽取的資料集較大，往往都是進行分布式的迭代計算。

mapreduce框架能夠很好的處理大規模的資料計算，但是在實現需要迭代類演算法時的效率比較低。一是由於為了提高可靠性，在map和reduce過程中都有寫磁碟的過程，計算結果並不是直接在計算子過程之間傳遞；對於迭代類的計算，這種模式會導致在迴圈計算中反覆i/o；二是map和reduce的序列結構還不能直接適用於迴圈或者鏈式的計算。儘管如此，map-reduce的計算思想對當前迭代計算框架的發展有很大的影響，許多框架或者基於mapreduce進行修改，或者借鑑了其計算思想進行設計。

下面是一些已有的迭代計算框架：