kafak是一種分布式的,基於發布/訂閱的訊息系統。以時間複雜度為o(1)的方式提供訊息持久化能力,即使對tb級以上資料也能保證常數時間複雜度的訪問效能。 高吞吐率。即使在非常廉價的商用機器上也能做到單機支援每秒100k條以上訊息的傳輸。支援kafka server間的訊息分割槽,及分布式消費,同時保證每個partition內的訊息順序傳輸。同時支援離線資料處理(hive、hbase)和實時資料處理(spark、storm)。
訊息系統的核心作用就是三點:解耦,非同步和並行
經典架構:flume + kafka + storm /spark streaming+ redis。
應用場景:訊息系統、跟蹤**活動、運營指標、日誌聚合、流處理、採集日誌、提交日誌。
simhash 介紹以及應用場景
simhash 演算法是一種區域性敏感的雜湊演算法,能實現相似文字內容的去重。資訊摘要演算法 如果兩者原始內容只相差乙個位元組,所產生的簽名也很有可能差別很大。simhash 演算法 如果原始內容只相差乙個位元組,所產生的簽名差別非常小。simhash值的對比 通過兩者的 simhash 值的二進位...
ActiveMQ的作用總結 應用場景及優勢
業務場景說明 訊息佇列在大型電子商務類 如京東 去哪兒等 有著深入的應用,佇列的主要作用是消除高併發訪問高峰,加快 的響應速度。在不使用訊息佇列的情況下,使用者的請求資料直接寫入資料庫,在高併發的情況下,會對資料庫造成巨大的壓力,同時也使得系統響應延遲加劇。在使用佇列後,使用者的請求發給佇列後立即返...
ActiveMQ的作用總結 應用場景及優勢
業務場景說明 訊息佇列在大型電子商務類 如京東 去哪兒等 有著深入的應用,佇列的主要作用是消除高併發訪問高峰,加快 的響應速度。在不使用訊息佇列的情況下,使用者的請求資料直接寫入資料庫,在高併發的情況下,會對資料庫造成巨大的壓力,同時也使得系統響應延遲加劇。在使用佇列後,使用者的請求發給佇列後立即返...