import numpy as np
import pandas as pd
import jieba
class
onehot
(object):
def__init__
(self)
: self.document =
"自然語言處理是電腦科學領域與人工智慧領域中的乙個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。"
defcut_document
(self)
:'''
將文字轉化為離雜湊表
'''return jieba.lcut(self.document)
defcut_document_and_clear
(self)
:'''
降重'''
return
list
(set
(jieba.lcut(self.document)))
defone_hot_vec
(self)
: columns = self.cut_document_and_clear(
) document = self.cut_document(
) onehotvec = np.zeros(
(len
(document)
,len
(columns)),
int)
for i,item in
enumerate
(document)
: onehotvec[i,columns.index(item)]=
1return onehotvec,columns
defword_frequency_statistics
(self)
: onehotvec,columns = self.one_hot_vec(
) result =
frequency = np.zeros(
len(onehotvec[0]
),int)
for i in
range
(len
(onehotvec)):
frequency += onehotvec[i]
for i in
range
(len
(columns)):
result[columns[i]
]= frequency[i]
return result
defshow_one_hot_vec
(self)
: onehotvec,columns = self.one_hot_vec(
)return pd.dataframe(onehotvec,columns=columns)
if __name__ ==
'__main__'
: myonehot = onehot(
)print
(myonehot.word_frequency_statistics(
))
產品產生過程
相關系統分析員向使用者初步了解需求,然後用相關的工具軟體列出要開發的系統的大功能模組,每個大功能模組有哪些小功能模組,對於有些需求比較明確相關的介面時,在這一步裡面可以初步定義好少量的介面。系統分析員深入了解和分析需求,根據自己的經驗和需求用word或相關的工具再做出乙份文件系統的功能需求文件。這次...
GC的產生過程
1 新生成的物件在eden區完成記憶體分配 2 當eden區滿了,再建立物件,會因為申請不到空間,觸發minorgc,進行young eden 1survivor 區的垃圾 為什麼是eden 1survivor 兩個survivor中始終有乙個survivor是空的,空的那個被標記成to survi...
飛秒雷射脈衝的產生過程
單一頻率的 雷射持續性的發光,其振幅不隨時間改變。但如何製造出雷射脈衝呢?把兩個相位相同 頻率不同的波相加,就會產生所謂的拍頻,加強性干涉的部分就會大幅增強,相消性干涉的部分則會互相抵銷。愈多條相位相同 頻率不同的波相加時,產生的拍頻也就愈短,尖峰的強度也愈大。但是,若把不同相位的光線彼此相加,則不...