Python自動化辦公都需要掌握什麼知識?

2021-10-12 22:57:07 字數 3027 閱讀 4938

知乎上有人提問:用python進行辦公自動化都需要學習什麼知識呢?

這可能是很多非it職場人士面臨的困惑,想把python用到工作中,卻不知如何下手?python在自動化辦公領域越來越受歡迎,批量處理簡直是加班族的福音。

自動化辦公無非是excel、ppt、word、郵件、檔案處理、資料分析處理、爬蟲這些,這次就來理一理python自動化辦公的那些知識點。

python基礎

excel自動化

ppt自動化

word自動化

郵件處理

檔案批量處理

資料處理與分析

自動化爬蟲

下面一一詳解。

能做這些的前提是會使用python,最起碼要熟悉基本語法,可以編寫小指令碼。

語法是關鍵,一定要理解python程式設計的基本概念,再去學其他的工具庫。

不然會很痛苦的。

office家族其實都可以用vba解決自動化的問題,但可能很多人不會用。

python針對excel有很多的第三方庫可以用,比如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。

python-excel 模組哪家強?

這些庫可以很方便地實現對excel檔案的增刪改寫、格式修改等,當然並不推薦你全部都去嘗試一下,這樣時間成本太大了。使用xlwings和pandas這兩個就夠了,基本能解決excel自動化的所有問題。

xlwings不光可以讀寫excel,還能進行格式調整、vba操作,非常強大且易於使用。

pandas是大家都熟悉的資料處理利器,它也支援excel的讀寫,介面友好。這個後面會講到。

python當然是支援ppt的自動化處理,主要的庫有pywin32com、pptx,可以建立、修改ppt檔案。

推薦使用pptx庫,目前主流的ppt處理庫。

學習**:

python操作word的庫:

python-docx、import docx:只對windows平台有效

pypiwin32、import win32com:跨平台,但無法處理doc格式的word文字,doc格式不是基於xml的

textract、import textract:它同時兼顧「doc」和「docx」,但安裝過程需要一些依賴。你可以批量的用python生成word檔案,推薦使用docx,不需要會太多。

學習**:

python處理郵件也是極其便利的,smtplib、imaplib、email三個庫配合使用,實現郵件編寫、傳送、接收、讀取等一系列自動化操作,省時省力。

簡單三步,用 python 發郵件

發郵件的坑在於郵箱伺服器的選擇和設定,而這個又會隨著郵箱服務商的更新而變動,所以實際使用時還需要多搜尋相關文件和教程。

檔案處理包括批量修改或建立檔名、批量生成文件、批量修改路徑等等重複性操作。如果乙個個手工操作,那真的心累。

python在處理批量操作有得天獨厚的優勢,成千上萬的檔案修改可能只需幾秒的時間。

os是python檔案操作的庫,可以實現對電腦上檔案的增刪改查。

我就是做資料分析工作的,基本也是python作為主要工具,所以這一塊毋庸置疑是python自動化辦公最有價值的部分。

資料處理的庫主要有:pandas、numpy、matplotlib、sklearn…

pandas是一款不斷進步的python資料科學庫,它的資料結構十分適合做資料處理,並且pandas納入了大量分析函式方法,以及常用統計學模型、視覺化處理。

如果你使用python做資料分析,在資料預處理的過程,幾乎九成的工作需要使用pandas完成。

在一些企業招分析師的筆試題中,pandas已經作為必考的工具,所以如果你想要入行資料分析師,請努力學習使用pandas。

numpy是python的數值計算庫,包括pandas之類的很多分析庫都建立在numpy基礎上。

numpy的核心功能包括:

ndarray,乙個具有向量算術運算和複雜廣播能力的快速且節省空間的多維陣列

用於對整組資料進行快速運算的標準數學函式(無需編寫迴圈)

用於讀寫磁碟資料的工具以及用於操作記憶體對映檔案的工具

線性代數、隨機數生成以及傅利葉變換功能

用於整合由c、c++、fortran等語言編寫的**的a c api

numpy之於數值計算特別重要是因為它可以高效處理大陣列的資料。這是因為:

比起python的內建序列,numpy陣列使用的記憶體更少

numpy可以在整個陣列上執行複雜的計算,而不需要python的for迴圈

matplotlib和seaborn是python主要的視覺化工具,建議大家都去學學,資料的展現和資料分析同樣重要。

sklearn和keras,sklearn是python機器學庫,涵蓋了大部分機器學習模型。keras是深度學習庫,它包含高效的數值庫theano和tensorflow。

爬蟲入門容易,但學精難,所以初學者可以嘗試寫點簡單的爬蟲,比如豆瓣、知乎、微博呀。

如果大家在學習中遇到困難,想找乙個python學習交流環境,可以加入我們的python圈,裙號609616831,可領取python學習資料,會節約很多時間,減少很多遇到的難題。

python自動化辦公(一)

os模組簡介os是pyhon標準庫,可以實現和作業系統有關的操作,例如建立,移動,複製檔案和資料夾,檔案路徑和名稱處理等等 注意 有些指令是windows,mac,linux通用,有些只在mac,linux下可用獲取當前python程式執行路徑方法 import os print os.gecwd ...

python自動化辦公 郵件收發

一 安裝郵件庫 pip install pyemail 二 郵件介面 這裡以qq郵箱來介紹 需要開啟qq郵箱的設定 賬戶裡smtp服務,接下來會通過傳送簡訊驗證來獲得授權碼,有了授權碼後就可以在 裡新增了 步驟如下 傳送簡訊後會生成授權碼 導入庫import smtplib from email.m...

python辦公自動化1 7 1 8 1 9

from tempfile import temporaryfile f temporaryfile w 表示寫入及讀取檔案 f.write hello 尹老師!f.seek 0 表示回到檔案的開頭位置 data f.readlines print data f.close 臨時資料夾 from t...