北京法院京牌小客車司法處置資料統計 Pandas

2021-08-21 18:08:48 字數 3075 閱讀 5090

最近我家參加了京牌小客車的司法拍賣。即參與京牌搖號失敗的人可以參加司法處置的京牌小客車的競拍。從2023年開始實施搖號政策以來參與搖號次數越多,越有可能成功競拍。我們參與的是 2023年7月26日拍賣的這一次。在拍賣前夕,官網放出了此次參與競拍的所有參與者的搖號次數,其中包括了大量的資料,有pdf 366頁之多。所以我想利用excel和pandas對這些資料做乙個整理和統計,看一看我家競拍成功的可能性究竟有多大。

【**在第二部分】

目錄

1 資料預處理

2 利用pandas進行資料處理

3 遇到的問題

這是乙個包含366頁資料的pdf……我最想知道的是,有多少人比我家搖號次數多。

接下來,我們要把這個pdf檔案轉換成excel檔案。我嘗試了兩種方法:

1、在smallpdf.com 上轉換 -->失敗

轉換以後得到的excel為(我去掉了頭兩行標題):

可以看到這三列的資訊合併為一列了。

所以,接下來的工作就是把三列拆分開來。

選擇:資料->分列

選擇分隔符號:

接下來選擇用空格進行分割:

完成後:

給出anaconda安裝pandas的指令:

進入虛擬環境(以我的環境名,env3為例):

activate env3
安裝pandas:

conda install pandas
先看一眼這次競拍到底有多少人參加:

import pandas as pd

df = pd.read_excel('buyerlist_201807.xlsx') # 讀取資料

df = pd.dataframe(df) # 構造資料

print(df.shape[0]) # 看一下資料大小

結果是。。一萬五千多人!!!

15345
看一下資料的索引和前幾行:

print(df.head(3)) # 前三排資料
搖號申請編碼  搖號次數     搖號註冊時間       unnamed: 3

0 566510581**** 7 2016-07-05 16:41:31.764000

1 826510012**** 63 2011-01-03 22:30:23.369000

2 956810166**** 39 2012-04-13 22:27:02.804000

司法拍賣設定的規則是,假如兩位競拍者的搖號次數相同,優先搖號註冊時間長的一位競拍。而我家的搖號次數是61,註冊時間為2011-01-17 19:32:25.587,確定有多少人比我家更有優勢的**是:

import pandas as pd

df = pd.read_excel('buyerlist_201807.xlsx') # 讀取資料

df = pd.dataframe(df) # 構造資料

# print(df.shape[0]) # 看一下資料大小

# print(df.head(3)) # 前三排資料

m = 0

for i in range(df.shape[0]):

if df.iloc[i, 1] > 61: # iloc用於提取資料中指定的某一行某一列

m += 1

elif df.iloc[i, 1] == 61:

date = str(df.iloc[i, 2])[:10]

date = ''.join(date.split('-'))

if int(date) < 20110117:

m += 1

elif int(date) == 20110117:

time = str(df.iloc[5, 3])

time = ''.join(time.split(':'))

if int(date) < 193225.587:

m += 1

print(m)

得到的結果是(我家前面有多少人):

1508
!!!是乙個讓人心碎的結果了(這批司法拍賣一共才有40輛車)。。。

用excel排序一下(excel沒辦法比較註冊時間),這個數字還是比較接近的,說明是乙個有說服力的結果。

根據上次2023年5月26日的競拍結果,報名競拍的人中有將近40%都選擇了**最低的那輛京牌小客車(我家避開了這個高峰):

假設這次排在前面的1508中依然有40%的人競拍最便宜的車,那麼剩下的將會有905人競拍39輛車,那麼意味著平均每輛車都有23個高分競爭者!!

以下是我在過程中遇到的問題和解決辦法,放在這裡作為參考:

importerror: no module named 'xlrd'

Python 京牌搖號 程式

想實現這個程式 有2個問題要解決 需要 到 random 模組和 string 模組。python 的模組庫是個寶藏,想實現任何功能它都有現成的模組供你調 importrandom importstring count 0 while count 3 car nums for i in range ...

苦等11年 京沈高鐵北京 承德段即將開通

據中國鐵程式設計客棧路官方訊息,10月21日14時05分,55001次首趟檢測列車從北京朝陽站發車,京沈高鐵京承段 北京至承德 正式進入聯調聯試階段。按照慣例,本次聯調聯試分為動態檢測 執行試驗兩個階段進行。動態檢測主要是通過檢測列車 試驗動車組和相關檢測裝置,在規定測試速度下對軌道 道岔 路基 橋...

北京繼續暫停計程車順風車出京運營 違規將嚴肅處理

程式設計客棧 www.cppcns.com 6月16日 訊息 昨日,北京市交通委員會下發 關於繼續暫停北京市計程車 含巡遊車 網約車 順風車出京運營業務的通知 稱,要求為做vguybh好新冠肺炎疫情防控工作,阻斷疫情通過計程車 含網約車 順風車傳播,自本通知印發之日起,暫停北京市計程車 含巡遊車 網...