# -*- coding: utf-8 -*-
#資料一般儲存在檔案(csv、txt、excel)和資料庫中
#1. 匯入csv檔案(第一行是列名)
from pandas import read_csv
#檔案的編碼格式也應該是 utf-8 才行,否則報錯
df = read_csv(
'd:/python/workspace/pythonstudy/jysj.csv',
encoding = 'utf-8'
)#2. 匯入文字檔案(比csv檔案自由,沒有規定第一行必須是列名)
from pandas import read_table
#沒匯入有列名的txt檔案(缺省會把第一行資料當作列名,為了避免,我們應該指定列名):
df = read_table(
'd:/python/workspace/pythonstudy/jysjwithoutcolumnname.txt',
names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
sep=',' #表示txt中的資料是以逗號隔開的(不加這一句會造成把所有的資料當成一列匯入進來)
)#匯入有列名的txt檔案
df = read_table(
'd:/python/workspace/pythonstudy/jysjwithcolumnname.txt',
names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
sep=','
)#3. 匯入excel檔案
#語法:read_excel(filename,sheetname,names)
from pandas import read_excel
df = read_excel(
'd:/python/workspace/pythonstudy/jysj.xls',
sheetname='吉木薩爾縣近三年房屋交易資訊'
)#4. 解決檔名包含中文的問題:
#加上engine引數即可:
df = read_excel(
'd:/python/workspace/pythonstudy/中文檔名.xls',
sheetname='吉木薩爾縣近三年房屋交易資訊',
#engine='python'
)
Python之資料處理
靠別人不如靠自己,學學學學學學學學!原資料 需求 coding utf 8 txtfile aminer1.txt newtxtfile open new txtfile,w with open txtfile,r as file to read lines file to read.readlin...
python之資料處理
檔案資料讀寫的基本操作 import this 本地檔案的界定 指向乙個本地儲存的檔案,是乙個連線或者乙個對映 path1 c users 11786 desktop test.txt 正斜線兩個或者反斜線乙個來用於資料路徑的表達 再或者用r 寫在檔案路徑外面 推薦第三種 path2 c users...
python筆記20 資料處理之資料分組
coding utf 8 概念 資料分組,根據資料分析物件的特徵,按照一定的數值指標,把資料分析物件劃分為不同的區間進行研究,以揭示 其內在的聯絡和規律性 cut函式 cut series,bins,right true,labels null series 需要分組的序列資料 bins 劃分陣列 ...