這個作業屬於哪個課程
[軟體工程]
這個作業在**
作業要求
這個作業的目標
**查重
github
psp 各個階段
自己預估的時間(分鐘)
實際的記錄(分鐘)
計畫60
需求分析 (包括學習新技術)
60生成設計文件
20設計複審
25**規範 (為目前的開發制定合適的規範)
10具體設計
60具體編碼
180**複審
60測試(自我測試,修改**,提交修改)
40報告
50測試報告
30計算工作量
25事後總結, 並提出過程改進計畫
60合計
680演算法關鍵
余弦相似度演算法:乙個向量空間中兩個向量夾角間的余弦值作為衡量兩個個體之間差異的大小,余弦值接近1,夾角趨於0,表明兩個向量越相似,余弦值接近於0,夾角趨於90度,表明兩個向量越不相似。
舉乙個例子來說明,用上述理論計算文字的相似性。為了簡單起見,先從句子著手。
句子a:這只皮靴號碼大了。那只號碼合適
句子b:這只皮靴號碼不小,那只更合適
怎樣計算上面兩句話的相似程度?
基本思路是:如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。
第一步,分詞。
句子a:這只/皮靴/號碼/大了。那只/號碼/合適。
句子b:這只/皮靴/號碼/不/小,那只/更/合適。
第二步,列出所有的詞。
這只,皮靴,號碼,大了。那只,合適,不,小,很
第三步,計算詞頻。
句子a:這只1,皮靴1,號碼2,大了1。那只1,合適1,不0,小0,更0
句子b:這只1,皮靴1,號碼1,大了0。那只1,合適1,不1,小1,更1
第四步,寫出詞頻向量。
句子a:(1,1,2,1,1,1,0,0,0)
句子b:(1,1,1,0,1,1,1,1,1)
第五步,根據余弦向量公式計算
/*輸入空檔案
e:/test/empty.txt是我建立的空文字
*/@test
public void example2();
try catch (ioexception a) }/*
輸入錯誤的路徑
輸入乙個空路徑
輸出路徑也為空
*/@test
public void example1();
try catch (ioexception a) }/*
輸入錯誤的輸出檔案路徑
e:/test是我本地資料夾
*/@test
public void example3();
try catch (ioexception a) }/*
原文本與其他文字測試
*///測試調換語序文字
@test
public void example6();
try catch (ioexception a)
}//測試調換語序文字
@test
public void example7();
try catch (ioexception a)
}//測試調換語序文字
@test
public void example8();
try catch (ioexception a)
}//測試增加20%的文字
@test
public void example4();
try catch (ioexception a)
}//測試刪除20%的文字
@test
public void example5();
try catch (ioexception a)
}//測試相同文字
@test
public void example9();
try catch (ioexception a)
}//測試相同文字
psp 各個階段
自己預估的時間(分鐘)
實際的記錄(分鐘)
計畫60
50需求分析 (包括學習新技術)
60120
生成設計文件
2025
設計複審
2530
**規範 (為目前的開發制定合適的規範)
1015
具體設計
6060
具體編碼
180180
**複審
6070
測試(自我測試,修改**,提交修改)
4050
報告50
50測試報告
3030
計算工作量
2525
事後總結, 並提出過程改進計畫
6060
合計465
765
第一次個人程式設計作業
psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫120 estimate 估計這個任務需要多少時間 120development 開發360 analysis 需求分析 包括學習新技術 60 design spec...
第一次個人程式設計作業
github倉庫位址 psp2.1 personal softwareprocess stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫50 60estimate 估計這個任務需要多少時間 3020 development 開發960 1080 analysis 需求分析 包括學習...
第一次個人程式設計作業
倉庫 psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫 estimate 估計這個任務需要多少時間100 development 開發 8802000 analysis 需求分析 包括學習新技術 240420 de...