1-1 資料壓縮的乙個基本問題是「我們要壓縮什麼」,對此你是怎麼理解的?
我們要壓縮的就是某訊號集合所佔的空域,時域和頻域空間。
1-2 資料壓縮的另乙個基本問題是「為什麼進行壓縮」,對此你又是怎麼理解的?
資訊時代帶來了「資訊**」。資料壓縮的作用及其社會效益、經濟效益將越來越明顯,如果不進行資料壓縮,無論傳輸或儲存都很難實用化。而資料壓縮就能較快的傳輸各種信源、在現有通訊幹線上開通更多的並行業務、降低發射功率和緊縮資料儲存容量。
1-6 資料壓縮技術是如何分類的?
根據有無失真編碼分為可逆壓縮和不可逆壓縮。無失真、無差錯編碼的叫可逆壓縮,有失真編碼的就是不可逆壓縮。
參考書《資料壓縮導論(第4版)》page 8 1.4
1、 壓縮前是169kb 壓縮後是165kb 壓縮比是0.97
***音訊 壓縮前是 3.29mb 壓縮後是3.26mb 壓縮比是 0.99
比較壓縮比發現:壓縮之前的檔案比較大的話,壓縮比就會比較大。
2、 對於來自不同**的文字,我們不能就其冗餘度做出定量論述,因為有的文字重複出現的次數多,一些次數少。冗餘度,通俗的講就是資料的重複度。在乙個資料集合中重複的資料稱為資料冗餘
三、參考書《資料壓縮導論(第4版)》page 30
3、給定符號集a=,求一下條件下的一階熵:
(a)p(a1)=p(a2)=p(a3)=p(a4)=1/4
(b)p(a1)=1/2 , p(a2)=1/4 , p(a3)=p(a4)=1/8
(c)p(a1)=0.505 , p(a2)=1/4 , p(a3)=1/4 , p(a4)=0.12
答:(a)一階熵為:
h(x)=4*(1/4)*log24=2(bit)
(b)一階熵為:
h(x)=1/2*log22+1/4*log24+2*(1/8)*log28=1.75(bit)
(c)一階熵為:
h(x)=0.505*log2101/200+2*(1/4)*log24+0.12*log23/25=1.745(bit)
5、考慮以下序列:
atgcttaacgtgcttaacctgaagcttccgctgaagaacctg
ctgaacccgcttaagcttaagctgaaccttctgaacctgctt
(a)根據此序列估計各概率值,並計算這一串行的一階、二階、三階和四階熵。
(b)根據這些熵,能否推斷此序列具有什麼樣的結構?
答:(a)共有84個字母,a出現21次,t出現23次,g出現16次,c出現24次,則
p(a)=21/84=1/4
p(t)=23/84
p(g)=16/84=4/21
p(c)=24/84=2/7
一階熵: h(x)=1/4*log24+23/84*log284/23+4/21*log221/4+2/7*log27/2=1.98(bit)
(b)7、做乙個實驗,看看乙個模型能夠多麼準確地描述乙個信源。
(a)編寫一段程式,從包括26個字母的符號集中隨機選擇字母,組成100個四字母單詞,這些單詞中有多少是有意義的?
其中有意義的單詞有:
roam n.漫步,漫遊;流浪
第一次作業
1.用較低的成本,開發出滿足客戶需求的軟體,開發的軟體可靠性高,易於維護和移植 2.分為設計階段,開發階段和測試執行階段 1 設計階段 分析客戶需求,明確要解決哪些問題,實現哪些功能,以及確定基本方法 2 開發階段 a.概要設計 畫出流程圖,進行模組化劃分,建立模組的層次結構以及呼叫關係 b.詳細設...
第一次作業
1.4 非計算機專業 程式和軟體有何不同?答 程式是通過計算機語言寫出來的具有許多演算法的摸板,是實現軟體功能的底層推手 推手的意思可以理解為動力 所以,程式是軟體的內在因子,而軟體是乙個或多個程式通過編譯器編譯出來的成品。1.3 查詢資料,解釋什麼是圖靈測試?答 指測試者與被測試者 乙個人和一台機...
第一次作業
1.解釋什麼是圖靈測試?圖靈測試 又稱 圖靈判斷 是圖靈提出的乙個關於機械人的著名判斷原則。一種測試機器是不是具備人類智慧型的方法。如果說現在有一台電腦,其運算速度非常快 記億容量和邏揖單元的數目也超過了人腦,而且還為這台電腦編寫了許多智慧型化的程式,並提供了合適種類的大量資料,使這台電腦能夠做一些...