今天用matlab整理了一天的資料集,心好累。
原始資料是這樣的,(152.0, 115.0, 167.0, 135.0), (221.0, 127.0, 240.0, 152.0)。
我需要把每個數字字元分出來。
關鍵**如下:
tline=fgets(fidin); %從檔案讀行
s=regexp(tline,'\([^)]*)','match'); %正規表示式,提取出每個括號中的內容。
%s是乙個字串,為(152.0, 115.0, 167.0, 135.0)
%s是乙個字串,為(221.0, 127.0, 240.0, 152.0)
m=numel(s);%s中字串的個數,此處等於2
fori=1:m
s2=(regexp(s,'\d*\.\d*', 'match'));
%這也是個正規表示式,作用是提取s字串中的數字部分。
forj=1:4
fprintf('%s',s2);
fprintf('\n');
endend%列印出來的s2就是分拆出來的數字
152.0
115.0
167.0
135.0
221.0
127.0
240.0
152.0
由上可以看出,正規表示式非常強大。
之後還經歷了檔案的刪除,
delete([path,filename]);
以及檔案的重新命名。
eval([『!rename』 32 strcat(path,filesname) 32 newname]);
需要注意的是,源檔名前面要加路徑,而目標檔名前面則不用。以及32和前後面都要有空格。(忍不住吐槽matlab改檔名為什麼這麼奇怪的寫法)
最後涉及到的問題就是讀寫xml檔案。xml檔案讀寫有兩種方法,一種是matlab自帶的函式,即xmlread,xmlwrite,這個用法感覺非常複雜。
第二種方法是使用工具包。
其提供的 xml_read和xml_write函式非常方便。**如下:
annotation = xml_read(strcat(path_label,label_name));
annotation.filename=files_all(i).name
;xml_write([strcat(path_label,label_name)],annotation);
即通過xml_read讀出來,然後修改節點內容,最後通過xml_write寫進去,就ok了。 鮑魚資料集處理 matlab
鮑魚資料集 屬性資訊 給出了屬性名稱,屬性型別,度量單位和簡要說明。環數是要 的值 可以是連續值,也可以是分類問題。名稱 資料型別 度量單位 描述 性別 名義 m,f和i 嬰兒 長度 連續 公釐 最長的外殼尺寸 直徑 連續 公釐 垂直於長度 高度 連續 公釐 帶有外殼的肉總 重 連續 克 整個鮑魚 ...
複雜網路資料集整理
複雜網路的研究很多都離不開資料集,下面這些是個人在做科研的過程中在網際網路上蒐集到的一些資料集 列舉出來也方便同行們去使用。1 2 3 4 5 6 搞資料探勘應該都或多或少知道aminer和唐杰,這是aminer上的一些社交網路資料集。7 這個 裡面有十幾個資料集,包含社交網路 交通網路 合作網路等...
步態識別資料集整理
按照時間順序,來自 資料集提出時間 資料型別 個體數和序列總數 環境視角數 變化cmu mobo 2001 rgb 輪廓圖 25 600室內6 3個走路速度 攜帶乙個球 soton 2002 rgb 輪廓圖 115 2128 室內 室外 2在treadmill上走路 casia a 2003 rgb...