Python爬虫之Selector选择器实战之xpa-科技资讯

Python爬虫之Selector选择器实战之xpa

发布日期：2023-03-09 12:42:59 作者：郭欣月浏览次数：224

导读

20230304星期六：爬虫之Selector选择器实战之xpath/css提取数据：# 方式一：# Selector选择器，xpath提取数据：all_trs = select.xpath('/*;q=0.8,application/signed-exchange;v=b3;q=0.9"}response = requ

20230304星期六：

爬虫之Selector选择器实战之xpath/css提取数据：

# 方式一：# Selector选择器，xpath提取数据：all_trs = select.xpath('/*;q=0.8,application/signed-exchange;v=b3;q=0.9"}response = requests.get(url,headers=headers)response.encoding = 'gb2312'# print(response.text)select = Selector(response.text)# 方式一：# Selector选择器，xpath提取数据：# all_trs = select.xpath('//*[等id="list"]/table/tbody/tr').getall()# 方式二：# Selector选择器，css提取数据：# #list > table > tbody# #list > table > tbody > tr:nth-child(1) > td:nth-child(1)all_trs = select.css('#list>table>tbody>tr').getall()print('all_trs',type(all_trs),len(all_trs),all_trs)# 提取数据：ip_list = []import refor li in all_trs: ip_img = re.findall("<td>(.*?)</td>",li) # print('=====') # print(type(ip_img),ip_img) ip = ip_img[0] port = ip_img[1] proxy_type = ip_img[3] ip_list.append(proxy_type+'\t'+ip+':'+port)print('ip_list：',ip_list)import datetimefilepath = './ip代理池_' + datetime.datetime.strftime(datetime.datetime.today(),"%Y%m%d_%H%M%S") + '.txt'print('filepath：',filepath)# 保存到文件：for ip in ip_list: with open(filepath,'a+',encoding='utf-8') as f: f.write(ip+'\n')

(文/郭欣月)

• 衣食父母是什么生肖动物,全面释义解释落实	• 衣食父母代表是什么生肖,标准作答落实
• 敝巾旧服是什么生肖,全面解释落实	• 敝巾旧服指是什么生肖,词语深度剖析解析落实
• 双绿生肖代表是什么生肖,精选答案落实	• 双绿生肖指什么生肖数字,词语解释落实
• 月悬碧空代表是什么生肖,成语解释落实	• 月悬碧空是什么生肖,答案解释落实
• 月悬碧空是代表什么生肖,成语解释落实	• 大露头角是指什么生肖,打一代表准确词语解释落
• 尽收眼底是什么生肖,打一准确词语解释梳理落实	• 对牛弹琴是什么生肖,打一经典完整解释落实
• 大露头角是代表什么生肖,答案分析落实	• 尽收眼底是指什么生肖,词语解释落实
• 对牛弹琴代表指什么生肖,精选解答落实	• 长年累月是什么生肖,成语释义解释落实
• 五彩斑斓代表什么生肖,成语解释经典释义	• 宫里太监是奴才，四到七数点玄机代表什么生肖,
• 十年四车成功德是指哪个动物,成语释义答案解释	• 是非不分打一经典生肖,成语解释落实

金牌

推广服务

Python爬虫之Selector选择器实战之xpa