概述 資料時代

2021-10-11 21:28:09 字數 1737 閱讀 9506

資訊時代就是資料的時代

問題求解的計算之道

what -> why -> how

數學:解決問題的終極工具

那麼如果光靠人用數學來解決問題(未知事物)太累了,數學家希爾伯特提出「能否找到一種基於有窮觀點的能行方法,來判定任何乙個數學命題的真假」,這就是計算數學概念的提出

基本思想是用機器來模擬人們用紙筆進行數學計算的過程

一條紙帶,乙個讀寫頭,使用者定義的有限個狀態

五元組(當前狀態,讀寫頭讀到的符號,讀寫頭欲寫的符號,如何移動讀寫頭,下乙個狀態)

計算數學關注的是「可計算性」。也就是是否能夠有窮能行地解決問題,而不在意解決的效率,即可行性。

計算複雜性理論只是對問題的難易程度有乙個分類,它是不管問題的解決方案的。

演算法不同,演算法是要給出問題的解決方案的。

電腦科學不僅僅是對於計算機的研究,它包括計算複雜性理論和演算法的研究

抽象:去除一些對事物影響不大的因素,從邏輯和物理兩個層次來分析事物

簡單的說就是一種封裝好的資料結構,在用的時候只要知道這個資料結構的各個介面,呼叫就行,而不需要知道這個資料結構的具體實現細節(這太常見了)

compile 編譯到機器碼

link 與各種庫鏈結

execute 執行目標程式

1、分析乙個問題的時候首先要從數學的角度來看,即能不能通過有窮觀點的能行方法來解決這個問題,注意有窮觀點的能行方法(即計算數學)並不是說只能解決計算機能解決的演算法問題的,它是涵蓋了理論推理等多種方法的。

2、計算複雜性理論和演算法理論是不同的,計算複雜性理論只是為這個問題定義界別,說這個問題是屬於簡單問題,中等的問題還是難的問題,但是演算法是要給出問題的解決方案的

3、在衡量乙個演算法的時候和衡量乙個程式的好壞的時候,這個演算法時間效率和這個程式的時間效率都是衡量好壞的乙個指標,除此之外,還有乙個空間效率也是乙個衡量的指標。 但是程式的衡量結果並不是這個演算法的衡量結果,程式的時間效率的衡量,如測算出這個程式執行的時間,跟執行機器,程式語言,和程式的實現技巧都有關係。而演算法的衡量只是邏輯上的衡量,如衡量演算法的時間效率,也就是演算法的時間複雜度時,我們想要知道這個演算法邏輯上的執行時間,我們選取演算法中的賦值語句作為基本語句,這是因為賦值語句兼顧取值,計算,儲存三個基本的步驟,這對應著計算機系統中的控制,運算,儲存三大功能,所以賦值語句更能體現計算機的操作特性,這樣我們就能通過演算法中賦值語句的多少來衡量演算法的時間效率(注意這時候程式可能還沒有寫出來,但是賦值語句的條數是可以估算的),然後不同的問題規模肯定對應出不同的賦值語句的條數,那麼演算法規模n對應賦值語句條數的函式就是演算法的時間複雜度,把一些不必要的因素,如常尾數,常係數去掉的表示方法就稱為大o表示法,因為它認為真正的賦值語句的條數不過是將大o中的函式做一些線性變換得到,然後大家都用大o表示法的話,事實上這也就會成為一種廣為流行的標準。因此大o中的函式也叫作數量級函式,由於去掉了常係數和低次項,實際上的o(n)來的要比t(n)小呢~~~

4、上面一點中闡述了衡量演算法和衡量程式的方法,兩者雖然方法不同,但是要知道程式肯定是根據演算法寫出來的嘛,所以程式在執行的時候針對不同的問題規模n,所執行的不同時間,也是滿足演算法的時間複雜度規律的,比如使用的演算法就是乙個n^2量級的時間複雜度的演算法,那麼這個程式在執行的時候它的執行時間和問題規模的函式曲線作出來肯定也是平方量級的。另外,針對相同的問題規模,不同的例項(如在排序演算法中,一組長度相同的不同資料)在同樣的演算法,賦值語句的條數也是不一樣的,即所需要的時間也是不一樣的,這樣就有三種演算法的時間複雜度了,即最好,最壞和平均,一般來說最好的時間複雜度對於我們理解問題沒啥意義了,因為這個就好像是投機取巧的意思,所以我們分析的是平均和最壞的時間複雜度呢。

大資料時代

大資料 巨量資料 big data 指的是需要新處理模式才能具有更強的決策力,洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。4v特點 volume 大量 velocity 高速 variety 多樣 value 價值 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。...

大資料時代

不斷的從 發現這個很具廣告特色的語句,他們總是鼓吹大資料時代的來臨,好像如果你沒抓住他,你就要立馬落後別人好幾條馬路。各種公司企業對他們的產品也宣稱產品是大資料時代不可或缺的科技 乙個錢學森相當於10個王牌師。國內到處充斥著浮躁,不管是大學還是業界,大家都想賺點錢一夜暴富然後過上高富帥的生活。大資料...

大資料時代的資料特點與大資料時代處理資料理念的改變

1 大資料時代的資料特點 4v 1.1 規模性 volume 即大資料具有相當的規模,其資料量非常巨大。資料的數量級別可劃分為b kb mb gb tb pb eb zb 等,而資料的數量級別為pb 級別的才能稱得上是大資料。1.2 多樣性 variety 即大資料的資料型別呈多樣性。資料型別繁多,...