def one_hot(word_dict, keywords):
cut_code = [word_dict[word] for word in keywords]
cut_code = [0]*len(word_dict)
for word in keywords:
cut_code[word_dict[word]] += 1
return cut_code
def extract_keyword(content):
re_exp = re.compile(r'()|(]+>)', re.s)
content = re_exp.sub(' ', content)
content = html.unescape(content)
seg = [i for i in jieba.cut(content, cut_all=true) if i != '']
keywords = jieba.analyse.extract_tags("|".join(seg), topk=200, withweight=false)
return keywords
計算模組介面部分的效能改進
消耗最大的部分
如圖所示,主函式消耗最大,符合預期
效能分析圖
計算模組部分單元測試展示
測試結果:
執行之後的結果如下圖所示
較為符合預期。
部分測試**:
if __name__ == '__main__':
encoding="utf-8") as y1:
content_x1 = x1.read()
content_y1 = y1.read()
similarity = cosinesimilarity(content_x1, content_y1)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y2:
content_x2 = x2.read()
content_y2 = y2.read()
similarity = cosinesimilarity(content_x2, content_y2)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y3:
content_x3 = x3.read()
content_y3 = y3.read()
similarity = cosinesimilarity(content_x3, content_y3)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y4:
content_x4 = x4.read()
content_y4 = y4.read()
similarity = cosinesimilarity(content_x4, content_y4)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y6:
content_x6 = x6.read()
content_y6 = y6.read()
similarity = cosinesimilarity(content_x6, content_y6)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y7:
content_x7 = x7.read()
content_y7 = y7.read()
similarity = cosinesimilarity(content_x7, content_y7)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y8:
content_x8 = x8.read()
content_y8 = y8.read()
similarity = cosinesimilarity(content_x8, content_y8)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y9:
content_x9 = x9.read()
content_y9 = y9.read()
similarity = cosinesimilarity(content_x9, content_y9)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y0:
content_x0 = x0.read()
content_y0 = y0.read()
similarity = cosinesimilarity(content_x0, content_y0)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
設計空白對比文件和完全一致的文件
完全不同對比文件的結果:
沒有異常。
完全一致文件的結果:
沒有異常。
psp2.1
personal software process stages
預估耗時(分鐘)
實際耗時(分鐘)
planning
計畫30
60estimate
估計這個任務需要多少時間
2020
development
開發480
480analysis
需求分析 (包括學習新技術)
300300
design spec
生成設計文件
6030
design review
設計複審
3010
coding standard
**規範 (為目前的開發制定合適的規範)
3010
design
具體設計
6060
coding
具體編碼
300300
code review
**複審
3030
test
測試(自我測試,修改**,提交修改)
12090
reporting
報告60
80test repor
測試報告
3020
size measurement
計算工作量
3015
postmortem & process improvement plan
事後總結, 並提出過程改進計畫
4035
total
合計1620
1600
我禿了也強了??
第一次個人程式設計作業
psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫120 estimate 估計這個任務需要多少時間 120development 開發360 analysis 需求分析 包括學習新技術 60 design spec...
第一次個人程式設計作業
github倉庫位址 psp2.1 personal softwareprocess stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫50 60estimate 估計這個任務需要多少時間 3020 development 開發960 1080 analysis 需求分析 包括學習...
第一次個人程式設計作業
倉庫 psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫 estimate 估計這個任務需要多少時間100 development 開發 8802000 analysis 需求分析 包括學習新技術 240420 de...