資料分類處理

2021-08-22 06:00:26 字數 1439 閱讀 8930

資訊社會,有海量的資料需要分析處理,比如公安局分析身份證號碼、 qq 使用者、手機號碼、銀行帳號等資訊及活動記錄。  

採集輸入大資料和分類規則,通過大資料分類處理程式,將大資料分類輸出。

一組輸入整數序列i和一組規則整數序列r,i和r序列的第乙個整數為序列的個數(個數不包含第乙個整數);整數範圍為0~0xffffffff,序列個數不限

從r依次中取出r,對i進行處理,找到滿足條件的i: 

i整數對應的數字需要連續包含r對應的數字。比如r為23,i為231,那麼i包含了r,條件滿足 。 

按r從小到大的順序:

(1)先輸出r; 

(2)再輸出滿足條件的i的個數; 

(3)然後輸出滿足條件的i在i序列中的位置索引(從0開始); 

(4)最後再輸出i。 

附加條件: 

(1)r需要從小到大排序。相同的r只需要輸出索引小的以及滿足條件的i,索引大的需要過濾掉 

(2)如果沒有滿足條件的i,對應的r不用輸出 

(3)最後需要在輸出序列的第乙個整數字置記錄後續整數序列的個數(不包含「個數」本身)

序列i:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第乙個15表明後續有15個整數) 

序列r:5,6,3,6,3,0(第乙個5表明後續有5個整數) 

輸出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786

說明:30----後續有30個整數

3----從小到大排序,第乙個r為0,但沒有滿足條件的i,不輸出0,而下乙個r是3

6---

存在6個包含3的i

0---

123所在的原序號為0 

123---

123包含3,滿足條件 

#include

#include

#include

#include

using namespace std;

bool match(int m,int n)

int main()

cin>>n;

for(int i=0;i>temp;

r.push_back(temp);          

}sort(r.begin(),r.end());//排序

r.erase(unique(r.begin(), r.end()), r.end());//去重

vectorindex;

vectorvalue;

vectorcnt;

vectorindex1;

for(int i=0;i0)//迴圈輸出r中r[i]在i中的位置和值

else

j++;}}

}return 0;

}

新聞分類 資料預處理

結構化資料,是可以表示成多行多列的形式,並且,每行 列 都有著具體的含義。非結構化資料,無法合理地表示為多行多列的形式,即使那樣表示,每行 列 也沒有具體的含義。文字資料,是一種非結構化資料,與我們之前分析的結構化資料有所不同。因此,其預處理的步驟與方式也會與結構化資料有所差異。文字資料預處理主要包...

資料分類處理 牛客網

題意理解 有兩個序列的整數,乙個序列當成規則序列,對於這個序列的每個整數,在另外乙個序列查詢包含這個整數的數,列印這個整數的序號和整數值。這個規則序列需要預先排序剔重,對於每個規則的整數找到的整數序列,列印規則的整數,找到的整數序列個數,每個匹配到的整數序號和整數值。最後在前面記錄總個數。問題分析 ...

情感分類之資料處理

深度學習的快速發展離不開龐大的資料量,做好資料處理是深度學習的第一步。然而paddlehub對自定義資料有格式要求,要求相應的資料格式為第一列是文字內容text a,第二列為文字類別label。列與列之間以tab鍵分隔。資料集檔案第一行為text a label 中間以tab鍵分隔 儲存為tsv檔案...