對於很多公司來說,開源並不是一件新鮮事。但是 facebook 在這方面做得尤為出色,因為他們開源的東西已真正的被很多人使用。有一家叫做 datastax 的新公司,就是靠著為 facebook 的開源資料庫 cassandra 使用者做技術支援來賺錢的。就連蘋果公司的資料中心,也在借鑑 facebook 開源出來的 ambitious 伺服器設計方案。
除此之外,facebook 最新的開源專案之一 presto,也已經贏得了許多外部公司的支援。作為乙個分布式 sql 查詢引擎,presto 被設計為用來專門進行高速、實時的資料分析。它支援標準的 ansi sql,包括複雜查詢、聚合(aggregation)、連線(join)和視窗函式(window functions)。就連中國的第二大電商京東**也是在 presto 的基礎之上進行研發、測試、改進,後來才形成了我們大家都所熟悉的 prestodb,它對京東的運維起到了很大的作用。
facebook 近來發布了乙個新的大資料工具版本,並發表言論稱,該版本比以前的版本快兩倍。但即使該產品沒有新的改進,但仍然得到了外部公司的支援,其中就包括:airbnb,dropbox 和 netflix。
像 hadoop 這樣新的大資料工具讓公司比較廉價而高效地儲存和分析海量資料。但是他們最終要求嚴格程式設計來分開使用。presto,簡而言之就是讓資料分析使用他們在新時代系統中來查詢資料儲存的sql 技巧,諸如 hadoop 和 cassandra。另外,它比用於查詢 hadoop 的標準工具快多啦。
它在很多方面都類似於其它的開源工具,諸如 cloudera』s impala 和 mapr』s drill,它們同樣都是在追求加速和簡化 hadoop 查詢。但 facebook 和許多像 cloudera 和 mapr 這樣的公司之間的不同在於,facebook 製造為己所用的工具,而不會考慮別的公司會怎麼用這個工具。就是說 facebook 開發的軟體在提供給其它**用之前,已經在這個世界上最大的**之一上進行了實戰測試。「我們將 presto 新增到我們的資料基礎設施工具中,因為它擁有乙個在真實環境中進行產品級使用的跟蹤記錄,」 dropbox 軟體工程師 fred wulff 說。(
Facebook開源Nuclide專案
作為全球最大的社交 facebook與 開源 關係密切。其開源專案負責人james pearce曾公開表示,facebook不僅起源於開源平台,也一直致力於建設乙個完整的開源 棧 環境。僅2014年,facebook就設立了107項開源專案,使其總的開源專案超過200個。通過開源專案的方式,face...
Facebook開源FriendFeed的實時技術
tornado是乙個用python寫的相對簡單的 不設障礙的web伺服器架構,用以處理上萬的同時的連線口,讓實時的web服務通暢起來。雖然跟現在的一些用python寫的web架構相似,比如google的diango,但tornado更注重速度,能夠處理海量的同時發生的流量。taylor認為torna...
Facebook開源FriendFeed的實時技術
tornado是乙個用python寫的相對簡單的 不設障礙的web伺服器架構,用以處理上萬的同時的連線口,讓實時的web服務通暢起來。雖然跟現在的一些用python寫的web架構相似,比如google的diango,但tornado更注重速度,能夠處理海量的同時發生的流量。taylor認為torna...