标签：爬虫 - 清弦小站

- 主页
- 文章
  - 时间线
  - 专栏
  - 标签
- 更多
- 暗黑模式

python爬虫基础——如何使用代理IP

使用爬虫采集数据时，常常会因为同一IP过于频繁的请求数据，导致IP被封禁。因此，使用代理IP轮换请求，可以降低被封的风险，提高数据采集的效率和稳定性。

本文以青果代理IP为例 ~~(青果打钱！)~~ 演示使用短效代理采集数据的方法：

青果网络

https://www.qg.net

2024-12-23 爬虫基础

python爬虫实战——微博点赞列表

python爬虫实战——微博点赞列表

通过请求json文件，获取网页数据，进而爬取无法直接在HTML结构中获得的数据。

2024-10-09 爬虫实战

python爬虫实战——小说爬取《我的师兄实在太稳健了》

基于requests库和lxml库编写的爬虫，目标小说网站域名http://www.365kk.cc/，类似的小说网站殊途同归，均可采用本文方法爬取。

目标网站：传送门

本文的目标书籍：《我的师兄实在太稳健了》

渡劫只有九成八的把握，和送死有什么区别？

2023-05-21 爬虫实战

scrapy爬虫实战03-爬取其他文件格式

Scrapy框架爬虫实战03，是对zcool精选图片的爬取，并以标题为文件名进行分割存储。对Scrapy框架有一定的理解后，再阅读本篇博客为好。

2022-08-07 爬虫实战

scrapy爬虫实战02-CrawlSpider入门

Scrapy框架实战2，主要是crawlSpider爬虫的入门，CrawlSpider要比基础的spider实用一些，不过还是建议看过Scrapy框架实战1的同学再来看这篇文章。

2022-08-07 爬虫实战

Scrapy爬虫实战01-古诗文网

Scrapy框架的应用案例1，基础的scrapy框架使用，过程应该还挺详细，便于大家查阅参考。

2022-08-07 爬虫实战

python爬虫实战演示

一些基于python的爬虫实战，记录了我和反爬斗智斗勇的心路历程。这篇文章最开始发表于2021年暑期，后来还被举报下架了，所以其中提到的网站反爬虫很可能已经“魔高一丈”，如果实现不了，不必纠结。

2022-08-06 爬虫实战

粘贴文本
全选文本
剪切文本
复制文本
站内搜索
必应搜索
新标签页打开
复制链接地址
复制图片
谷歌识图
暗黑模式
打印页面
阅读模式