magic()函式用來產生魔方矩陣。魔方矩陣中每行、列和兩條對角線上的元素和相等。
a=magic(3)
a =816
3574
92>> b=magic(4)
b =1623
135111089
76124
1415
1
主要包括數值型別,邏輯型別,字串,函式控制代碼,結構體和單元陣列型別。
整數型別
數值的預設儲存型別是雙精度浮點型別,在轉換成整數過程中,預設將待轉換數值轉換為與之最為接近的整數值,此點與c++完全不同,需特別注意。
int32(
820.1
)ans =
int32
820>> int32(
820.9
)ans =
int32
821
浮點數型別
單精度與雙精度相比占用記憶體小,但能表示的數值範圍和精度也小。
無窮量(inf)和非數值型(nan)
無窮量一般用於超出範圍 nan由於0/0或int/int.
乙個字串是儲存在乙個行向量中的文字,這個行向量中的每乙個元素代表乙個字元,每乙個字元占用兩個位元組的記憶體。實際上,元素中存放的是字元的內部**,也就是ascii碼。當在螢幕上顯示字元變數的值時,顯示出來的是文字,而不是ascii數字。由於字串是以向量的形式來儲存的,所以可以通過它的下標對字串中的任何乙個元素進行訪問。 字元矩陣也可以這樣,但是它的每行字元數必須相同。
例如
s=『snbkjbkbvk』
s=char(x)
輸出長度(size)
返回乙個行向量,其元素包含 a 的相應維度的長度。
>> size(
'qwe 12'
)ans =
16
水平連線(streat)和垂直連線(strvcat)ab=strcat(a,b)
ab =
'today is saturdayi want to go home'
>> ab=strvcat(a,b)
ab =
2×17 char 陣列
'today is saturday'
'i want to go home'
尋找(findstr)
格式:k=findstr(『str1』,『str2』)
尋找字串1中第幾個字元開始有字串2,則k為n。
findstr(
'the'
,'is the the girl'
)ans =
48
替換函式(strrep)
strrep(s1,s2,s3)
s2為s1中含有的字串,s3為替換s2的字串,s為替換後的。
s=strrep(
'the girl'
,'the'
,'that'
)s =
'that girl'
比較(strcmp)
strcmp(s1,s2)
此 matlab 函式 比較 s1 和 s2,如果二者相同,則返回 1 (true),否則返回 0
(false)。如果文字的大小和內容相同,則它們將視為相等。返回結果 tf 的資料型別為 logical。
strcmp(
's1'
,'s2'
)ans =
logical
0>> strcmp(
's',
's')
ans =
logical
1
DataWhale 資料探勘 Task3
特徵工程 import pandas as pd import numpy as np import tsfresh as tsf from tsfresh import extract features,select features from tsfresh.utilities.datafram...
task3初級演算法
熵 原本物理學中的定義,後來夏農將其引申到啦資訊理論領域,用來表示資訊量的大小。資訊量大 分類越不 純淨 對應的熵值就越大,反之亦然。資訊熵的計算公式 聯合熵 一維隨機變數分布推廣到多維隨機變數分布。聯合熵的計算公式 條件熵 h y x 表示在已知隨機變數 x 的條件下隨機變數 y 的不確定性。條件...
Task 3 特徵工程
1 通過箱線圖 或3 sigma 分析刪除異常值 2 box cox轉換 處理有偏分布 3 長尾截斷 1 標準化 換為正態分佈 2 歸一化 3 針對冪律分布,可採用公式 1 x 1 median 1 等頻分桶 2 等距分桶 3 best ks 分桶 類似利用基尼指數進行二分類 4 卡方分桶 1 不處...