Please enable JavaScript.
Coggle requires JavaScript to display documents.
网络请求函数 (requests.get() (response.text()
直接抓取数据,没有经过解码
response.content()…
网络请求函数
requests.get()
response.text()
直接抓取数据,没有经过解码
response.content()
自行猜测编码,需要自行解码
response.content.decode(‘utf-8’)
根据自己要的编码解码
-
-
xpath
1、Element.xpath来执行xpath代码
html.xpath()
2、获取标签属性
href = html.xpath(‘//a/@href’)
3、获取文本
address = tr.xpath('./td[4]/text()')
4、在某标签下执行xpath进一步提取数据
应该加一个点来获取当前元素下
address = tr.xpath('./td[4]/text()')
-
-
-
-
-
-
-
-
-
-
lxml解析
1、lxml.etree.HTML字符串解析
etree.HTML(string)
2、lxml.etree.parse 解析不规范的xml文件需要指定解析器如下
lxml.HTMLparser()