我还以为终于加 captcha 或者启用 cf 的验证是否为浏览器功能了。毕竟现在包括 NH 在内的很多网站都有,EH 没有反而奇怪。
没想到只是把 pageno 换成 gid。
区别可能就是:如果想完整爬一遍EH,以前可以一次加入几十页的画廊,现在只能一页一页抓。
但是总共页数也没有多少,要不了多久就能拿到所有画廊。
工作最多的还是在下载画廊,每页有几十画廊,每个画廊也有几十页,而这和更新前一样。
更不用说旧的爬虫站只需要抓最新的画廊。
我很怀疑这种反爬策略的效果。
-----------------------------------------------------------------对我个人还真是正面提升,我很少随机选一个靠后的页码。
我看不完就会加入 onetab,以后再打开从原来的地方接着看。如果有重复画廊还是很烦的。
虽然 url 中的 gid 不是连续的可能有点怪,但如果从“每个 url 对应的内容不变”的角度来考虑还是合理的。
无论如何,总比 waterfall flow 好。
不过最有意思的还是这个评论:
QUOTE
nice update. We can do the same thing on E-Hentai Forums without page-selector.
以及这个:
QUOTE
(IMG:[
i.imgur.com]
https://i.imgur.com/Ebg0nBi.png)
Can you also add NEXT BACK here and in every manga doujinshi? Because its so good
This post has been edited by azureice: Nov 3 2022, 15:05