1.爬網頁用的庫
import urllib.request #爬網頁的庫
req=urllib.request.urlopen('') #傳送網路請求
rsp=req.read() #獲得網頁html
2.基本型別
list= #列表,元素可改變
tunp=() #元組,元素不可改變
dic= #字典,key不重複
dic["lxp"]=23 #名字到年紀的對映
3.排序 ,內建排序sort(fun,key,reverse=false)
引數fun是表明此sort函式是基於何種演算法進行排序的,一般預設情況下python中用的是歸併排序,並且一般情況下我們是不會重寫此引數的,所以基本可以忽略;
引數key用來指定乙個函式,此函式在每次元素比較時被呼叫,此函式代表排序的規則,也就是你按照什麼規則對你的序列進行排序;
引數reverse是用來表明是否逆序,預設的false情況下是按照公升序的規則進行排序的,當reverse=true時,便會按照降序進行排序。
strlist=["1lxp","3dbb","2hz"] #想按字串開頭的數字降序排序
strlist.sort(key=lambda i:i[0],reverse=true)
4.lambda表示式
n=lambda i:i+1 #輸入i,返回i+1
等效於:
def func(i):
return i+1
n=func(i)
5.文字處理
file1=open('lxp.txt','r') #唯讀開啟
file2=open('lxp.txt','w') #寫開啟
print (str,file=file2) #輸出到檔案2
line=file1.readlines() #讀取檔案1到line,line此時是列表
line=file1.readline() #讀取檔案1一行內容,line是string,結尾帶換行符'\n'
strip()函式
str.strip(char) #移除str頭尾處的char字元
line=file1.readline()
print (line.strip('\n'),file=file2) #消除換行符
split()函式:以某一字元分割字串
str="123$sadf$ieo"
sl=str.split('$')
得到sl=["123","sadf","ieo"]
6.坑......:空格和tab不要混用.....
7.迴圈
for迴圈。 for迴圈可以遍歷任何序列的專案,如乙個列表或者乙個字串。
for i in range(100) #遍歷(0,100)
for i in range (10,100) #遍歷(10,100)
for i in list #遍歷列表
for i in str #遍歷字串
while迴圈
while condit:
...
if i in list:
if i not in list: elif: else:
8.字串操作
str="hello"
s1=str[0:2] #擷取下標0,1,「he」
s2=str[2:] #擷取下標2開始到最後
s3=str[:4] #擷取開始到下標3
左閉右開
工效學 百度百科
工效學是根據人的心理 生理和身體結構等因素,研究人 機械 環境相互間的合理關係,以保證人們安全 健康 舒適地工作,並取得滿意的工作效果的機械工程分支學科。工效學吸收了自然科學和社會科學的廣泛知識內容,是一門涉及面很廣的邊緣學科。在機械工業中,工效學著重研究如何使設計的機器 工具 成套裝置的操作方法和...
python百度文庫文字提取 百度文庫文字爬取
import requests import re import json headers 模擬手機 def get num url response requests.get url,headers headers text print response result re.search r md...
python怎麼百度文庫 《python》
字串 字串是 字元的序列 字串基本上就是一組單詞。使用單引號 你可以用單引號指示字串,就如同 quote me on this 這樣。所有的空白,即空格和 製表符都照原樣保留。使用雙引號 在雙引號中的字串與單引號中的字串的使用完全相同,例如 what s your name?使用三引號 或利用三引號...