04 微博訊息的語言檢測

2021-09-23 21:45:56 字數 1540 閱讀 2903

鄭昀 201010 隸屬於《02.資料解析》小節

大意是,封裝google語言檢測ajax web service的介面,輸入一段話,輸出語言種類。這個方法是從rssmeme.com看來的,經測試效果還不錯,可用於檢測微部落格訊息的語言,如中文、日文、韓文等。但由於google對過於頻繁的請求會重置鏈結,所以提請注意,這個web service不適合大量密集請求提交。 

訪問鏈結,你可以看到返回結果是乙個json字串:

, "responsedetails": null, "responsestatus": 200}

記得加版本號引數:v=1.0,否則返回如下json:

舉例,送去檢測的微部落格訊息是:

rt @ufotable: 本日22時より星海社ウェブサイト「最前線」にて『阪本真綾の満月朗読館』第二夜『山月記』が 配信されます。第二夜の映像演出も弊社デジタル部が擔當い…

經過urlencode變換後,提交到google,返回的結果是:

, "responsedetails": null, "responsestatus": 200}

這樣用result['responsedata']['language']就獲得了語言的代號。

只要檢查這個代號不是「zh-cn」,那麼就不是中文語言了。

示範:import urllib

"""從外可以傳入httplib例項,便於在外部加設**軟體穿牆"""

"""輸入文字如果檢測到是zh-cn,返回true,否則返回false"""

data = self.post_sentence(text)['responsedata']

if(data):

language = data['language']

if(language=='zh-cn'):

return true

return false

04 微博訊息的語言檢測

鄭昀 201010 隸屬於 02.資料解析 小節 大意是,封裝google語言檢測ajax web service的介面,輸入一段話,輸出語言種類。這個方法是從rssmeme.com看來的,經測試效果還不錯,可用於檢測微部落格訊息的語言,如中文 日文 韓文等。但由於google對過於頻繁的請求會重置...

微博傳送訊息

微博發布 發布 當我往微博裡裡面新增訊息之後,點選發布按鈕,那麼我們開始輸入 的內容就會被傳送出去,當我們點選傳送的時候,會建立 乙個無序列表ul和li標籤,傳送之前還會判斷內容是否為空,如果為空了,將不能夠傳送。傳送成功後,會在下面顯示出來,並且會新增乙個刪除功能,當我們點選刪除按鈕時,這個內容就...

微博的訊息佇列

最近一兩年,大部分系統的資料流由基於日誌的離線處理方式轉變成實時的流式處理方式,並逐漸形成幾種通用的使用方式,以下介紹微博的訊息佇列體系。當前的主要訊息佇列分成如圖3部分 1 feed資訊流主流程處理,圖中中間的流程,通過相關mq worker將資料寫入cache redis及mysql,以便使用者...