最近在學習python程式設計,按照笨方法學python的方法一步一步抄**,算是入了門。
後來公司想讓我從海量郵件資料中提取出關鍵字段進行分析,主要是從郵件中統計關鍵字段來檢視使用者的分布。
對一封郵件的關鍵字提取思路應該是比較簡單的,先把郵件拆分解析成可以進行正規表示式計算的字串形式,然後從郵件的正文中提取出需要的關鍵字段。比如,time zone:+08:00,我們就可以利用正規表示式把+08:00寫入excel文件,最後統計分析有幾個+08:00的郵件反饋到公司。
比較麻煩的點在於公司一天能收到幾千封類似的郵件,利用網上部落格裡面流行的imaplib的方法進行分析的話會受到很多外部因素的限制。比如無法保證幾千封郵件都精確遍歷過,比如imaplib方法裡面的資料夾屬性等定義比較複雜等問題。為了簡化此過程,我利用foxmail的郵件匯出功能,把上千封郵件匯出到本地,利用遍歷本地資料夾下的.eml格式檔案的方法進行了統計分析。
Python資料分析筆記 檔案資料讀取
讀取檔案內容首行 path c users etisan desktop a.txt open path readline 注 檔案路徑要用雙反斜槓 第乙個 的作用是轉義字元 讀取檔案內容某一行 records line for line in open path records 1 匯入json,...
郵件學習 python傳送郵件分析
首先呼叫python傳送乙個郵件 usr bin python3 import smtplib from email.mime.text import mimetext from email.utils import formataddr my sender 111111111 qq.com 發件人...
利用python 批量傳送郵件
這個 的主要作用是可以 批量傳送郵件,且免登入郵箱。smtp mail transfer protocol 即簡單郵件傳輸協議,它是一組用於由源位址到目的位址傳送郵件的規則,由它來控制信件的中轉方式。python的smtplib提供了一種很方便的途徑傳送電子郵件。它對smtp協議進行了簡單的封裝。s...