遇到乙個問題,需要讀取乙個csv檔案,然後取其中一列,然後求這一列每個資料出現的概率,然後求其資訊熵。
import numpy as np;
import math
import pandas as pd;
df=pd.read_csv("table10.csv") #讀取檔案
h=df.loc[:,'firstseensrcip'].value_counts(normalize=true) #求出其概率
valuelist=list(h.values) #概率輸出位series陣列,將其轉化為list
def entropy(list): #此函式求資訊熵,將list作為引數傳入即可
result=-1;
if(len(list)>0):
result=0;
for x in list:
result=((-x)*math.log(x,2)+result)
return result;
print(entropy(valuelist)) #列印
Python 資料處理
將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...
Python 資料處理
本場 chat 為 python 資料處理課程,包括 python 基礎知識 極簡教程 提公升 python 執行效率的方法 爬蟲簡介 scrapy selenium 自動化測試框架 簡易分布式 redis 分詞程式設計 jieba 資料儲存 本地資料上傳 hive 通過本場 chat 讀者可學到以...
Python資料處理
用傳統的電子 來處理資料不僅效率低下,而且無法處理某些格式的資料,對於混亂或龐大的資料集更是束手無策。本書將教你如何利用語法簡單 容易上手的python輕鬆處理資料。作者通過循序漸進的練習,詳細介紹如何有效地獲取 清洗 分析與呈現資料,如何將資料處理過程自動化,如何安排檔案編輯與清洗任務,如何處理更...