豆瓣的基礎架構

2022-09-01 19:12:09 字數 512 閱讀 4364

豆瓣的基礎架構

離線部分則包括資料探勘、資料分析等,技術元件分別是海量分布式檔案系統moosefs,這個文 件系統的結構類似hdfs,用c語言編寫,其好處在於fuse模組實現的比較好,用檔案系統就可以直接進行操作,而不需要專門的命令,可以支援的資料量也 很大。另外就是自己開發的分布式計算平台dpark。dpark繼承了spark可以使用記憶體做為快取加速分布式計算這個優點,在豆瓣的應用場景下,因為我們的 離線計算很多是推薦演算法計算,這種計算涉及大量的迭代演算法,如果每次計算的結果都入磁碟再在下一輪計算載入,那效能是很差的,所以dpark能夠大幅提公升效能

對於新技術的引入上,豆瓣整體是比較偏激進的,鼓勵大家去看看新的技術。當然也不會看到新的就上,這裡面有一些限制:乙個是比較重要 的服務如果要上新的技術,一定要有成功案例,且成功案例有跟我們量級差不多的規模,這樣可以降低風險;另乙個是對於引入的新技術一定要吃透——大部分引入 的技術肯定是要做二次開發的,所以拿進來的技術你必須保證能完全理解它的**結構,出了問題能修,能去掉自己無法掌控的東西。

參看:雲時代架構筆記

豆瓣的基礎架構

beansdb專案可以說是乙個簡化版的aws dynamodb,該專案在2008年啟動,2009年開源,第 版使 tokyo cabinet作為儲存引擎,2010年使 bitcask儲存格式重寫了儲存引擎,效能更好。beansdb對key做雜湊運算找到節點來實現分布和冗 餘,乙個寫操作會寫好幾個節點...

豆瓣的基礎架構讀後感

beansdb主要的特點是支援海量kv資料庫 相比redis這種支援幾十個g到幾百個g的 記憶體kv資料庫,beansdb可以支援到上百t的資料。另外beansdb最大的好處就是運維很簡單,效能 可用性 擴容都很好,也實現了最終一致性。跟豆瓣其他工程團隊一樣,平台部也強制大家做code review...

mysql架構 MySQL的基礎架構

mysql是關聯式資料庫,關聯式資料庫,顧名思義,是建立在關係模型基礎上的資料庫,我們現實世界中的各種實體以及實體之間的各種聯絡一般可用關係模型來表示。經過數十年的發展,關聯式資料庫在理論和工業實踐中都已經發展到很成熟的地步,可以說,目前的絕大部分應用,使用mysql都有成熟的解決方案。資料庫的架構...