Python文字中選取地點位置

2021-10-08 07:49:55 字數 2845 閱讀 1185

1.固定格式求地點

location_str =

['長沙開區橄欖城小區'

]#data_zhuti_qumin_tq[1]#投訴長沙開區橄欖城小區車位違建#["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "朝陽區北苑華貿城"]

import addressparser

df = addressparser.transform(location_str)

print

(df)

結果

2.一段文字求地點

import paddlehub as hub

lac = hub.module(name=

'lac'

)test_text=

['投訴長沙開區橄欖城小區車位違建'

]#,'衡陽縣關市網咖常年收留未成年人上網']

inputs =

results = lac.lexical_analysis(data = inputs)

for result in results:

print

(result[

'word'])

print

(result[

'tag'

])

loc =

''for i in

range

(len

(result[

'tag'])

):if result[

'tag'

][i]

=='loc'

: loc += result[

'word'

][i]

print

(loc)

3.正規表示式相似文字求地點

import re

import paddlehub as hub

import addressparser

lac = hub.module(name=

'lac'

)def

location(id

):#輸入問題id可以求特定人群地點

loc_sum =

''#主題裡抽取出所有提取的地點,後邊識別會更完善

true = biaoge2[

'id']==

idfor i in

range

(len

(biaoge2[true]

.head())

):test_text=

[list

(biaoge2[true]

['主題'])

[i]]

#,'網咖常年收留未成年人上網']

inputs =

results = lac.lexical_analysis(data = inputs)

for result in results:

loc =

''for i in

range

(len

(result[

'tag'])

):if result[

'tag'

][i]

=='loc'

:# or 'org':

loc += result[

'word'

][i]

#print(loc)

loc_sum += loc

loc_str =

[loc_sum]

loc_str_split = addressparser.transform(loc_str)

#對具體位址的處理

loc_str_split_dizhi = re.sub(

'([^市]+市|[^縣]+縣)',''

,str

(list

(loc_str_split[

'位址'])

))#刪除市和縣的內容

loc_str_split_dizhi_list =

list

(set

(re.findall(

'([^鎮]+鎮|[^村]+村|[^區]+區|[^街]+街)'

,loc_str_split_dizhi)))

#提取具體座標

loc_str_split_dizhi_easy =

''for j in

range

(len

(loc_str_split_dizhi_list)):

#連線具體位址

loc_str_split_dizhi_easy += loc_str_split_dizhi_list[j]

loc_str_split[

'位址'

]= loc_str_split_dizhi_easy

location =

list

(loc_str_split[

'市']

+loc_str_split[

'區']

+loc_str_split[

'位址'])

[0]return location

# print(result['word'])

# print(result['tag'])

location(

1)

隨機選取演算法 有權重的記錄中選取

三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...

隨機選取演算法 有權重的記錄中選取

三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...

Python 從列表中選取任意個元素求和

碰到乙個比較好玩的問題,我有許多小額的發票,需要從這些發票中湊出乙個指定的整數來。怎麼去實現呢?這些小額發票,我們可以用乙個列表來表示。比如a 1,3,5,6,8 那麼這個列表的元素可能產生多少種組合呢?由於列表裡面每乙個元素都可能有,也可能沒有。所以這裡面就有2的5次方種變化。驗證 ps 參考cs...