1-1:資料壓縮的乙個基本問題是「我們要壓縮什麼」,對此你是怎樣理解的?
答:我們為了盡量使數字資訊在傳輸過程中不出錯或少出錯,以最少的數碼表示信源所發的訊號,減少容納給定訊息集合或資料取樣集合的訊號空間。所謂訊號空間即被壓縮物件。
1-2:資料壓縮的另乙個基本問題是「為什麼進行壓縮」,對此你又是怎樣理解的?
答:資料壓縮的作用及其社會效益將越來越明顯,如果不進行資料壓縮,則無論傳輸或儲存都很難實用化。而資料壓縮的好處:
1、較快的傳輸各種信源(降低通道占有費用)——時間域的壓縮
2、頻率域的壓縮
3、能量域的壓縮
4、空間域的壓縮
1-6:資料壓縮是如何分類的?
答:可逆壓縮(無失真壓縮)和不可逆壓縮(有失真壓縮)。
可逆壓縮也叫無失真、無差錯編碼或無雜訊編碼。不可逆壓縮就是有失真編碼,資訊理論中稱熵壓縮。
參考書《資料壓縮導論(第4版)》page 8 1.4
答:1、
2、它表徵信源資訊率的多餘程度,是描述信源客觀統計特性的乙個物理量,但我們並不能對冗餘度進行定量論述。不同信源的冗餘度不同。
三、參考書《資料壓縮導論(第4版)》page 30
3、給定符號集a=,求一下條件下的一階熵:
(a)p(a1)=p(a2)=p(a3)=p(a4)=1/4
(b)p(a1)=1/2 , p(a2)=1/4 , p(a3)=p(a4)=1/8
(c)p(a1)=0.505 , p(a2)=1/4 , p(a3)=1/4 , p(a4)=0.12
答:(a)一階熵為:
h(x)=4*(1/4)*log24=2(bit)
(b)一階熵為:
h(x)=1/2*log22+(1/4)*log24+2*(1/8)*log28=1.75(bit)
(c)一階熵為:
0.505*log2101/200+2*(1/4)log24+0.12*log233/25=
5、考慮以下序列:
atgcttaacgtgcttaacctgaagcttccgctgaagaacctg
ctgaacccgcttaagcttaagctgaaccttctgaacctgctt
(a)根據此序列估計各概率值,並計算這一串行的一階、二階、三階和四階熵。
(b)根據這些熵,能否推斷此序列具有什麼樣的結構?
答:此序列總共有84個字母,其中字母a有21,字母t有23,字母g有16,字母c有24個
因此p(a)=21/84=1/4;p(t)=23/84;p(g)=16/84=4/21;p(c)=24/84=2/7;
則這一串行的一階熵為
h(x)=1/4*log24-23/84*log2(23/84)-4/21*log2(4/21)-2/7*log2(2/7)
=1/2+1/2+2.22*1/5+0.514
=1+0.44+0.514
=1.954(bit)
p(at)=1/42,p(gc)=5/42,p(aa)=5/42,p(cg)=2/42=1/21,p(tt)=5/42,p(tg)=2/42=1/21,p(ct)=7/42,p(ta)=1/42,p(ac)=3/42=1/14,p(ga)=4/42=2/21,p(ag)=2/42=1/21,p(tc)=1/42,p(cc)=3/42=1/14,p(tg)=1/42;
這一串行的二階熵為
h(x)=-4*(1/42)*log2(1/42)-3*(5/42)*log2(5/42)-4*(1/21)log2(1/21)-2*(1/14)log2(1/14)
=2/21*5.39+3/8*3+4/21*4.39+1/7*3.81
=3.02(bit)
由於p(atg)=1/28,p(ctt)=1/4,p(aac)=3/14,p(gtg)=1/28,p(ctg)=1/4,p(aag)=1/7,p(ccg)=1/14
則這一串行的三階熵為
h(x)=2*( 1/28)*log228-2*(1/4)*log2(1/4)-1/7*log2(1/7)-1/14*log2(1/14)
=1/14*4.81+1/2*2+1/7*2.81+1/14*3.81
=2.02(bit)
(b)由(a)的結果可以推斷此序列具有的結構是:由越多字母組成序列的資訊量越少,相應的,越少的字母組成的序列所包含的資訊量越多
7、做乙個實驗,看看乙個模型能夠多麼準確地描述乙個信源。
(a)編寫一段程式,從包括26個字母的符號集中隨機選擇字母,組成100個四字母單詞,這些單詞中有多少是有意義的?
第一次作業
1.用較低的成本,開發出滿足客戶需求的軟體,開發的軟體可靠性高,易於維護和移植 2.分為設計階段,開發階段和測試執行階段 1 設計階段 分析客戶需求,明確要解決哪些問題,實現哪些功能,以及確定基本方法 2 開發階段 a.概要設計 畫出流程圖,進行模組化劃分,建立模組的層次結構以及呼叫關係 b.詳細設...
第一次作業
1.4 非計算機專業 程式和軟體有何不同?答 程式是通過計算機語言寫出來的具有許多演算法的摸板,是實現軟體功能的底層推手 推手的意思可以理解為動力 所以,程式是軟體的內在因子,而軟體是乙個或多個程式通過編譯器編譯出來的成品。1.3 查詢資料,解釋什麼是圖靈測試?答 指測試者與被測試者 乙個人和一台機...
第一次作業
1.解釋什麼是圖靈測試?圖靈測試 又稱 圖靈判斷 是圖靈提出的乙個關於機械人的著名判斷原則。一種測試機器是不是具備人類智慧型的方法。如果說現在有一台電腦,其運算速度非常快 記億容量和邏揖單元的數目也超過了人腦,而且還為這台電腦編寫了許多智慧型化的程式,並提供了合適種類的大量資料,使這台電腦能夠做一些...