這種情況,用谷歌外掛程式來解決最為合適
第一步探索,f12看原始碼
發現乙個可利用的點,複製的 文字 都會在 乙個 id為 reader-search-button 的a標籤中,以引數的形式附在href中。
這樣就可以取出
var texta = document.getelementbyid("reader-search-button").getattribute("href");
texta = texta.substr(texta.indexof("word=") + 5);
texta = texta.split('%0a').join('\n\t ');
如果複製的內容剛好跨過分頁,就會出現大量沒用的內容:
處理函式:
if(texta.indexof("%20")>0)
之後發現一些付費的文件無法複製:
只好另外想辦法:
用自己寫的滑鼠選擇函式來獲取:
$('#reader-container-inner-1').mouseup(function () )
發現獲取的內容都沒有換行,要自己靠空格來判斷是否換行,有時會不準確。所以兩種方法一起用比較合適。
最終的**:
/**
* create by 彩虹海
* 此外掛程式僅供學習使用,請勿用於商業用途!
*/$(document).ready(function ()
$("#doc-header-test").css("z-index", 9999);
"清空選中按 ctrl+c 複製
關閉" +
"" +
""); $('#reader-container-inner-1').mouseup(function () )
$("#mycopy").click(function ()
if (texta == null || texta == "" || texta.length == 0)
mycopya();
$("#showcopy").show();
})$("#showcopy").hide();
} catch (e)
});
效果:
付費的:
共享的:
跨頁的:
這個剛開始是想直接改變其限制複製的js內容,把限制去掉。但是經檢視js發現,它的顯示的js和限制的js是放到同乙個js檔案裡的,而且這個js還用到其他js的定義的東西,越看越複雜,還是直接從頁面的顯示上下功夫吧。。。
總結一下,這種方式只使用於文字的複製。複製出來可以先做個 做個 編輯 再複製。
python百度文庫文字提取 百度文庫文字爬取
import requests import re import json headers 模擬手機 def get num url response requests.get url,headers headers text print response result re.search r md...
百度文庫爬蟲
可用的page number 0 10 20 30 根據url和type爬取檔案類容 doc和txt檔案使用不同的爬取方法 爬取的結果儲存在txt outputs search word freefromwenku main.py 程式入口 readme.md read me requirement...
如何免費複製百度文庫中的文章
首先,我們按照平常的習慣,找到自己要的 attach 8100 attach 文章不能複製,題目總是可以的吧。我們把題目記住之後,在搜尋引擎的框框裡輸入 site wenku.baidu.com 題目 site 命令是指在制定的 裡搜尋,加號也是要的,如果嫌輸入加號麻煩,可以用空格代替。如搜尋and...