大資料是什麼?多大的資料叫大資料?
很多沒有接觸過大資料的人,都很難清楚地知道,究竟多大的資料量才可以稱之為大資料。那麼,根據資料收集的埠,企業端與個人端之間,大資料的數量級別是不同的。
企業端(b端)資料近十萬的級別,就可以稱為大資料;個人端(c端)的大資料要達到千萬級別。收集渠道沒有特定要求,pc端、移動端或傳統渠道都可以,重點要達到這樣數量級的有效資料,形成資料服務即可。很有趣,大家可以看到2b和2c,兩類大資料差了兩個數量級。
有些小公司,資料只有千到萬級的規模,但經過收集分析,也能從中有針對性的總結出這一群體的原則,同樣能指導企業進行一定程度的使用者分析、獲取或者是服務工作,但這並不是大資料,而是一般性的資料探勘。
大資料的產業鏈是怎樣的?
大資料採集公司
所謂「找資料」,內部可以再分兩種:
1).在自身正常運營的過程中就能產生大量資料來源;
2).通過跟電信運營商、金融企業合作,獲取資料源。
大資料分析公司
這一類公司,基本上都有自己的套模型,但大部分資料庫模型源於相同的幾個機理,包括統計學模型、深度學習演算法等等。也基於美國ibm、cloudera公司開發的應用型分析模組等等。
大資料銷售公司
雖然說是賣資料,但**的並不是單一資料,而是基於資料的全套解決方案,比如精準營銷等等。
如何理解大資料的投資價值?
大資料如今這麼火,其商業價值顯而易見,但是能真正兌現的人並不多。
所以,對於資料相關的公司,在投資判斷的時候,不單是看現有業務的發展,更重要的是在他不斷的發展的過程中,能不能積累有效資料、積累高準確性的資料,實現資料的實時更新性。這樣的企業才能夠更好地建立起競爭壁壘。
比如,在開發者服務領域,比如talkingdata極光等等,我們復星昆仲在看專案時非常看重的一點,就是現在專案所經營的業務是單一為開發者提供服務?還是在服務之餘,給自己的積累有效資料,形成長期壁壘?
2b是大資料行業的突破口
可見,如果想投資大資料領域的公司,從c端下手難度很高。所以,我覺得在如果想在大資料行業布局,2b領域才是關鍵:一方面2b發展較晚,bat還沒有形成壟斷;第二,開發門檻相對較高的;第三,資料量需求量相對較少,達到十萬級別就可以為大資料的分析服務,所以如果想在大資料領域進行投資,要關注的主要領域是2b領域。
在2b領域,有三個不同的類別:
第一類,是現在很火的企業服務,以saas為主;比如客戶管理的crm、人力板塊的hrm等等。他們在得到使用者許可並保證資料安全的前提下,通過服務大量的企業來積累企業使用者,和企業員工資料。比如理才網等等。
第二類,是b2b交易平台;目前的趨勢,基本上是行業垂直領域的電子商務交易平台,核心競爭力就是打破買賣雙方的資訊不對稱、不透明。所以這種領域公司的關鍵點並不是記錄交易量,而是每乙個有效的資料資訊。在這個領域,我們投資過惠民網,主要服務於中小商超和其供貨商的交易平台,再比如各種「找」系列專案等等。
復星昆仲主要是在這三類的2b專案當中的進行投資,因為這些專案的2b業務模式可以有效積累大資料。這就是為什麼復星同時關注大資料和2b領域的企業服務——因為在2b領域的企業服務,能夠找到最好最有效的大資料。
2b行業的未來投資標
如果我們**一下這個行業的未來,我有以下幾個觀點。
擁有豐富大資料來源的企業,會成為整個行業內最炙手可熱的投資標的。
在大資料行業裡,分析演算法上的差別,造成的分析結果準確性、實用性的差異是93分和95分的區別。而因資料來源質量造成的差別,是60分和90分的不同。特別是,乙個不斷更新的大資料,是能夠驗證這個演算法準確性並不斷優化大資料分析結果的有效途徑。
先行繫結最急需資料的需求方的專案,將獲得勝利。
目前,在大資料領域最願意買單的基本都是金融領域的客戶,銀行、保險公司等等。他們要對使用者進行多方位的分析和服務,所以購買意願非常強。下一層,是新興的網際網路公司,為了更精準的獲取使用者、提高轉化率,也比較願意買單,比如說像新美大等等。下一步,可能會過渡到消費品行業當中去。
基於大資料的那些商機
saas類專案憑什麼火?
很多人其實不明白saas模式和傳統的軟體服務到底有什麼區別,為什麼說它是乙個基於大資料而興起的行業呢?
saas和傳統軟體服務,中間有非常多的區別。最基礎的區別,就是他們整個架構是不同的:saas是建立在公有雲上的,標準化的模組服務,資料也儲存在saas的公有雲平台上。而傳統的軟體服務基本上是部署在區域網內的。這種架構上的區別決定所有的其他區別。
比如,因為saas架構在雲端,而且秉承標準化、普適化原則,所以,實施過程非常快。至少,實施前的現場搭建工作要少很多,那麼獲取使用者也相應的加快。能傳統模式要很長時間才能累計幾百個客戶,而saas模式可以在短時間內累積上千、上萬的客戶都不難。
再比如,付費模式上的不同,傳統軟體有前期實施費、每年更新的費用、專門的定**務費用、故障解決費用等等。整體來講,費用高、繳費繁複,往往只有大企業才消費的起。而saas一方面減少了初期部署成本、且系統和架構可以服務於多個使用者。它的收費模式基本上,是收月費或者年費,乙個月只有幾百塊,很多中小企業,都可以享受到服務。
智慧型硬體和人工智慧的收穫期還很漫長
大資料和智慧型硬體相結合的模式,其實目前還很有挑戰性,最主要的原因還是出在大資料的數量級上。目前智慧型硬體的出貨量遠不能匹配大資料所需的數量級。目前,國內出貨量最大的是小公尺手環,第二是360兒童衛士。剩下的智慧型硬體出貨量,往往在十幾萬到幾十萬就是比較好的量級。這跟c端大資料千萬、億級的要求還相差百倍呢。
人工智慧領域相對好一些,屬於如日方公升的情況。在海外的谷歌、亞馬遜、軟銀,已經在投資一些投資標的,但是依然是一些概念領域的專案,不是立即可以商業化的服務。包括谷歌的無人車,就算已經能夠積累了上百萬英里的安全駕駛里程,但要應用還是有一定過程。國內也有少數的天使、早期機構,已經看好這個領域開始投資,但它的開花結果期那可能還要至少再等五年。
所以,這個領域的投資要有一定耐心,目前比較有希望兌現的領域,包括語音語義識別、ar/vr、無人機等。
大資料有多大?
本文計算人類產生資料的能力。那麼,大資料到底有多大?是不是像某些人想的那樣,可以趨近於無限大呢?在某些時候,我也會這麼想,可是不能把科幻寫成吹牛皮,明明4k的畫質就已經很清晰了,偏偏科幻出乙個4000k的畫質,這沒有意義。下文中,我們就具體計算一下,人類到底能夠產生多大的資料。計算過程 80億人 8...
大資料的兩面性 大資料,多大的資料才是大資料?
大資料的本質是統計學,是通過統計分析得出最終結果。比如我們經常會使用到的影象識別,為什麼手機能識別出來那些可能你也不知道的東西,因為那是建立在海量資料資料的基礎之上的。就連如今人人都會用到的手機美顏也是,相機美顏的本質是把你的臉往標準上靠,這個 標準 也就是所有人臉的平均值,是最符合審美的標準臉。資...
大資料,多大算「大
在資料 氾濫 的今天,人人都在提 大資料 但多大的資料才算 大 呢?如果盲目的強調 大 結果只會被資料淹沒,從而導致資訊過量,最終對決策不僅沒有幫助反而使人困惑 不知所措。今天,我們來談一談資訊過量的問題。資料分析的目的 我們對資料做分析的目的是將資料轉化成資訊,從而幫助人們更好的做決策。因此,決策...