Please enable JavaScript.
Coggle requires JavaScript to display documents.
Python 網路爬蟲 (工具 (XPath (XPath 教程 (阿布), XPath 快速鍵 Ctrl+F), python中執行cmd的方式…
Python 網路爬蟲
工具
XPath
XPath 教程
阿布
XPath 快速鍵 Ctrl+F
IP 請求訊息工具
python中執行cmd的方式
Python 執行 Command Line
python调用cmd命令三种方法
重要套件
瀏覽器
selenium
操作瀏覽器
import 的方式
需要firefox
webdriver.Firefox
WebElement
webbrowser(URL)
打開網頁
使用webbrowser的函數r將網頁抓到本地再分析
步驟
抓取文檔
requests
requests.get(URL)
回傳res
res.raise_for_status()
檢查response是否有錯誤
res.text
回傳內容
res.status_code
response 的status
res.iter_content(N個byte)
requests.code_ok
解析文檔
beautifulsoup
beautifulsoup.select('tag')
lxml
html=etree.HTML(contemt)
html.xpath('Xpath規則')
包含內容,有一些字串會包含空格導致搜尋規則失敗此時用contents來解決這個問題
a[contains(test(),'下一頁')]
/div[
class='f-list-item
'] => /div[
contains(@class
,'f-list-item')]
找網頁的規則
剪貼版的內容
sys.argv
案例