百度文庫複製工具 谷歌外掛程式開發

2021-09-04 02:19:01 字數 1889 閱讀 3808

這種情況,用谷歌外掛程式來解決最為合適

第一步探索,f12看原始碼

發現乙個可利用的點,複製的 文字 都會在 乙個 id為 reader-search-button 的a標籤中,以引數的形式附在href中。

這樣就可以取出

var texta = document.getelementbyid("reader-search-button").getattribute("href");

texta = texta.substr(texta.indexof("word=") + 5);

texta = texta.split('%0a').join('\n\t ');

如果複製的內容剛好跨過分頁,就會出現大量沒用的內容:

處理函式:

if(texta.indexof("%20")>0)

之後發現一些付費的文件無法複製:

只好另外想辦法:

用自己寫的滑鼠選擇函式來獲取:

$('#reader-container-inner-1').mouseup(function () )
發現獲取的內容都沒有換行,要自己靠空格來判斷是否換行,有時會不準確。所以兩種方法一起用比較合適。

最終的**:

/**

* create by 彩虹海

* 此外掛程式僅供學習使用,請勿用於商業用途!

*/$(document).ready(function ()

$("#doc-header-test").css("z-index", 9999);

"清空選中按 ctrl+c 複製

關閉" +

"" +

""); $('#reader-container-inner-1').mouseup(function () )

$("#mycopy").click(function ()

if (texta == null || texta == "" || texta.length == 0)

mycopya();

$("#showcopy").show();

})$("#showcopy").hide();

} catch (e)

});

效果:

付費的:

共享的:

跨頁的:

這個剛開始是想直接改變其限制複製的js內容,把限制去掉。但是經檢視js發現,它的顯示的js和限制的js是放到同乙個js檔案裡的,而且這個js還用到其他js的定義的東西,越看越複雜,還是直接從頁面的顯示上下功夫吧。。。

總結一下,這種方式只使用於文字的複製。複製出來可以先做個 做個 編輯 再複製。

python百度文庫文字提取 百度文庫文字爬取

import requests import re import json headers 模擬手機 def get num url response requests.get url,headers headers text print response result re.search r md...

百度文庫爬蟲

可用的page number 0 10 20 30 根據url和type爬取檔案類容 doc和txt檔案使用不同的爬取方法 爬取的結果儲存在txt outputs search word freefromwenku main.py 程式入口 readme.md read me requirement...

如何免費複製百度文庫中的文章

首先,我們按照平常的習慣,找到自己要的 attach 8100 attach 文章不能複製,題目總是可以的吧。我們把題目記住之後,在搜尋引擎的框框裡輸入 site wenku.baidu.com 題目 site 命令是指在制定的 裡搜尋,加號也是要的,如果嫌輸入加號麻煩,可以用空格代替。如搜尋and...