在失蹤兒童資訊儲存在本地之後,有乙個欄位是失蹤地點,字段內容通常比較詳細,具體到了失蹤的街道或者村,我打算通過某種方法將失蹤地點中的省、市、縣/區**位址提取出來。
知道要幹什麼之後,那就將這個「某種方法」確定下來,根據以往的知識積累,利用分詞的原理來做,可能會更簡單。這次就不用php來寫了,換成python,在我的電腦上已經安裝了python的開發環境,在python下使用的分詞元件,搜尋了一下,jieba用的比較多,而且呼叫也非常的容易。
因此,還需要將資料表中province_name,city_name,county_name提取出來即可,逐行存入檔案就成為可以使用的字典檔案。
import pymysql
class anmanmysql:
phost = '127.0.0.1'
pyuer = 'root'
password = '123456'
database = 'anman_org'
def pymyconnection(phost,pyuser,password,database):
db = pymysql.connect(phost,pyuser,password,database,charset="utf8")
# cursor = db.cursor()
return db
# 匯出省市縣鎮村字典
def getdict(db):
cursor = db.cursor()
cursor.execute("select distinct province_name from j_position")
data = cursor.fetchall()
# 開啟字典檔案my.dict
fo = open("my.dict","w+")
for da in data:
print(da[0])
fo.seek(0,2)
fo.write(da[0]+"\n")
print(len(data))
cursor.execute("select distinct city_name from j_position")
data = cursor.fetchall()
for da in data:
print(da[0])
fo.seek(0, 2)
fo.write(da[0] + "\n")
print(len(data))
cursor.execute("select distinct county_name from j_position")
data = cursor.fetchall()
for da in data:
print(da[0])
fo.seek(0, 2)
fo.write(da[0] + "\n")
print(len(data))
cursor.execute("select distinct town_name from j_position")
data = cursor.fetchall()
for da in data:
print(da[0])
fo.seek(0, 2)
fo.write(da[0] + "\n")
print(len(data))
# cursor.execute("select distinct village_name,village_id from j_position")
# data = cursor.fetchall()
# for da in data:
# print(da[0])
# print(da[1])
# fo.seek(0, 2)
# fo.write(da[0] + "\n")
# print(len(data))
fo.close()
在python裡新建乙個類,增加乙個方法,開啟乙個字典檔案,逐個從資料庫中distinct欄位,然後逐行追加到字典檔案中。
用Python獲取最新的省 市 縣
因為資料庫的資料資訊建於12年,很多地區 關係和名稱都跟不上了,讓我手動乙個個新增又覺得麻煩,怎麼說我也是乙個碼農而不是文員,上 usr bin env python coding utf 8 import requests from lxml import etree import sys imp...
Python獲取全國所有的省 市 縣 鎮 村
usr bin python3 coding utf 8 author he 通過國家統計局資料 獲取中國所有城市列表 獲取全國省份和直轄市 獲取省下級市 獲取市下級縣 縣下級鎮 鎮下級村 print 省 c citytr u url,he header,lists p print 市 o coun...
使用python與高德api獲取省市縣區
現在我發現用高德的api介面爬取資料會簡單好多,首先高德是免費的,至少現在的資料需求量上是免費的 其次高德提供了非常完美的介面供我們呼叫,找到方向後其實爬取相應的資料是很簡單得,首先去高德獲取自己的key值 大概就是在這個位置,下面這個key值就很關鍵,然後在web服務api下,你可以找到具體的使用...