Selenium Chromedriver被反爬如何隐藏Chromedriver特征码

2022年5月10日18:15:57 42 39,767 ℃

最近做一个爬虫项目，是通过selenium模拟浏览器进行爬取的，当启用chromedriver无头模式时就会无法正常访问，按照网上的方法隐藏了一些chromedriver的特征码还是无法访问。

通过网上资料发现，实际上Selenium 启动的浏览器，有几十个特征可以被网站通过 JavaScript 探测到。可以通过访问https://bot.sannysoft.com/进行测试。

正常通过浏览器访问该网站，结果如图：

通过Selenium Chromedriver 无头模式（--headless）打开该网站，结果如图：

在Chromedriver的headless模式下面，如何才能全部隐藏这些特征呢？

我在网上找到了一个stealth.min.js文件可以隐藏这些特征，这个文件的生成方式可以参考，github地址是https://github.com/berstend/puppeteer-extra/tree/master/packages/extract-stealth-evasions

具体的使用方法如下：

# -*- coding: utf-8 -*-
"""
    :author: 阿汤博客
    :Description: selenium chromedriver 特征码隐藏
    :CreateTime: 2022-05-10 17:02:05
"""
import time
from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options
chrome = Options()
chrome.add_argument('--headless')
chrome.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36')
chrome.add_argument('--disable-gpu')
chrome.add_argument('--no-sandbox')
browser = Chrome(options=chrome)
with open('./stealth.min.js') as f:
    js = f.read()
    browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
        "source": js
    })
browser.get('https://bot.sannysoft.com/')
time.sleep(1)
# 保存为图片
browser.save_screenshot('atang.png')
# 可以保存源代码为 html 再双击打开，查看完整结果
source = browser.page_source
with open('atang.html', 'w') as f:
    f.write(source)

运行代码查看atang.png：

再查看atang.html文件：

发现和我们通过浏览器访问https://bot.sannysoft.com/结果一致了。

如果觉得stealth.min.js文件自己生成麻烦，可以直接访问我的网盘获取，我已经生成好了。

文件下载

下载密码：发表评论并刷新可见！

下载地址

【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

Python

版权声明：本站原创文章，于2022年5月10日18:15:57，由 阿汤博客 发表，共 1537 字。
转载请注明：Selenium Chromedriver被反爬如何隐藏Chromedriver特征码 - 阿汤博客

发表评论取消回复

目前评论：42 其中：访客 0 博主 0

懂得都懂 0
回复 2022年9月19日下午6:02 沙发

看看怎么搞
哈瓦那 0
回复 2022年9月21日下午5:18 板凳

多谢博主
sfdfs 0
回复 2022年10月20日上午10:11 地板

谢谢分享！！！！
没有 0
回复 2022年12月16日下午5:25 4楼

看看
休闲鞋 1
回复 2022年12月20日下午6:38 5楼

非常不错
休闲鞋 1
回复 2022年12月20日下午6:40 6楼

看看怎么用
莫文中 0
回复 2022年12月30日下午3:04 7楼

漂亮
xxx 0
回复 2023年1月4日下午4:17 8楼

多谢博主
123 0
回复 2023年1月13日下午2:12 9楼

厉害
2332 0
回复 2023年2月13日下午5:28 10楼

非常不错
a 1
回复 2023年2月18日上午11:03 11楼

可以很详细
a 1
回复 2023年2月18日上午11:19 12楼

感谢
yy 1
回复 2023年3月24日下午3:23 13楼

赞
yy 1
回复 2023年3月24日下午3:24 14楼

赞赞赞
yy 1
回复 2023年3月24日下午3:25 15楼

多谢博主
韩大帅 1
回复 2023年5月10日上午10:25 16楼

看看
韩大帅 1
回复 2023年5月10日上午10:26 17楼

看看看
ss 0
回复 2023年5月15日上午10:34 18楼

赞
hugh 0
回复 2023年6月1日下午7:57 19楼

感谢分享
zgh 0
回复 2023年6月8日下午8:43 20楼

谢谢
势必达成 0
回复 2023年6月16日下午2:30 21楼

牛的
new牛 1
回复 2023年7月4日下午12:06 22楼

new牛
哦豁 0
回复 2023年7月25日下午4:52 23楼

哦豁
sun 0
回复 2023年8月25日下午10:38 24楼

看起来不错
夕下墨阳 0
回复 2023年9月3日上午6:34 25楼

多谢博主
士大夫 0
回复 2023年9月14日上午8:38 26楼

下载看看
155265046 0
回复 2023年10月14日上午9:39 27楼

多谢
1as 1
回复 2023年10月16日下午9:21 28楼

牛
1as 1
回复 2023年10月16日下午9:22 29楼

阿萨
800o 1
回复 2023年10月18日下午11:11 30楼

多谢博主
800o 1
回复 2023年10月18日下午11:13 31楼

多谢博主“
hen牛的牛 1
回复 2023年12月9日上午10:33 32楼

真是太厉害了
hen牛的牛 1
回复 2023年12月9日上午10:40 33楼

怎么下载呢
小斌斌 1
回复 2023年12月16日下午12:14 34楼

学习看下行不行
小斌斌 1
回复 2023年12月16日下午12:18 35楼

提取码在哪里怎么看不到啊
qiangqiang 0
回复 2024年1月20日下午9:05 36楼

nb 无敌
看看 0
回复 2024年2月6日下午6:40 37楼

多谢
感谢楼主 1
回复 2024年3月10日下午8:03 38楼

感谢楼主
感谢楼主 1
回复 2024年3月10日下午8:04 39楼

谢谢楼主分享
sss 1
回复 2024年6月3日下午7:59 40楼

厉害
sss 1
回复 2024年6月3日下午8:00 41楼

所以密码是啥
天 0
回复 2025年3月4日下午4:53 42楼

好用吗

文章目录
繁
微信

联系博主