python資料處理

遇到乙個問題，需要讀取乙個csv檔案，然後取其中一列，然後求這一列每個資料出現的概率，然後求其資訊熵。

import numpy as np;
import math
import pandas as pd;
df=pd.read_csv("table10.csv")           #讀取檔案
h=df.loc[:,'firstseensrcip'].value_counts(normalize=true)       #求出其概率
valuelist=list(h.values)                #概率輸出位series陣列，將其轉化為list
def entropy(list):                              #此函式求資訊熵，將list作為引數傳入即可
result=-1;
if(len(list)>0):
result=0;
for x in list:
result=((-x)*math.log(x,2)+result)
return result;
print(entropy(valuelist))       #列印

Python 資料處理

將檔案切分，存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...

Python 資料處理

本場 chat 為 python 資料處理課程，包括 python 基礎知識極簡教程提公升 python 執行效率的方法爬蟲簡介 scrapy selenium 自動化測試框架簡易分布式 redis 分詞程式設計 jieba 資料儲存本地資料上傳 hive 通過本場 chat 讀者可學到以...

Python資料處理

用傳統的電子來處理資料不僅效率低下，而且無法處理某些格式的資料，對於混亂或龐大的資料集更是束手無策。本書將教你如何利用語法簡單容易上手的python輕鬆處理資料。作者通過循序漸進的練習，詳細介紹如何有效地獲取清洗分析與呈現資料，如何將資料處理過程自動化，如何安排檔案編輯與清洗任務，如何處理更...

python資料處理

Python 資料處理

Python 資料處理

Python資料處理

相關推薦