1.固定格式求地點
location_str =
['長沙開區橄欖城小區'
]#data_zhuti_qumin_tq[1]#投訴長沙開區橄欖城小區車位違建#["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "朝陽區北苑華貿城"]
import addressparser
df = addressparser.transform(location_str)
print
(df)
結果
2.一段文字求地點
import paddlehub as hub
lac = hub.module(name=
'lac'
)test_text=
['投訴長沙開區橄欖城小區車位違建'
]#,'衡陽縣關市網咖常年收留未成年人上網']
inputs =
results = lac.lexical_analysis(data = inputs)
for result in results:
print
(result[
'word'])
print
(result[
'tag'
])
loc =
''for i in
range
(len
(result[
'tag'])
):if result[
'tag'
][i]
=='loc'
: loc += result[
'word'
][i]
print
(loc)
3.正規表示式相似文字求地點
import re
import paddlehub as hub
import addressparser
lac = hub.module(name=
'lac'
)def
location(id
):#輸入問題id可以求特定人群地點
loc_sum =
''#主題裡抽取出所有提取的地點,後邊識別會更完善
true = biaoge2[
'id']==
idfor i in
range
(len
(biaoge2[true]
.head())
):test_text=
[list
(biaoge2[true]
['主題'])
[i]]
#,'網咖常年收留未成年人上網']
inputs =
results = lac.lexical_analysis(data = inputs)
for result in results:
loc =
''for i in
range
(len
(result[
'tag'])
):if result[
'tag'
][i]
=='loc'
:# or 'org':
loc += result[
'word'
][i]
#print(loc)
loc_sum += loc
loc_str =
[loc_sum]
loc_str_split = addressparser.transform(loc_str)
#對具體位址的處理
loc_str_split_dizhi = re.sub(
'([^市]+市|[^縣]+縣)',''
,str
(list
(loc_str_split[
'位址'])
))#刪除市和縣的內容
loc_str_split_dizhi_list =
list
(set
(re.findall(
'([^鎮]+鎮|[^村]+村|[^區]+區|[^街]+街)'
,loc_str_split_dizhi)))
#提取具體座標
loc_str_split_dizhi_easy =
''for j in
range
(len
(loc_str_split_dizhi_list)):
#連線具體位址
loc_str_split_dizhi_easy += loc_str_split_dizhi_list[j]
loc_str_split[
'位址'
]= loc_str_split_dizhi_easy
location =
list
(loc_str_split[
'市']
+loc_str_split[
'區']
+loc_str_split[
'位址'])
[0]return location
# print(result['word'])
# print(result['tag'])
location(
1)
隨機選取演算法 有權重的記錄中選取
三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...
隨機選取演算法 有權重的記錄中選取
三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...
Python 從列表中選取任意個元素求和
碰到乙個比較好玩的問題,我有許多小額的發票,需要從這些發票中湊出乙個指定的整數來。怎麼去實現呢?這些小額發票,我們可以用乙個列表來表示。比如a 1,3,5,6,8 那麼這個列表的元素可能產生多少種組合呢?由於列表裡面每乙個元素都可能有,也可能沒有。所以這裡面就有2的5次方種變化。驗證 ps 參考cs...