Python爬虫requests库本身并不能直接处理验证码,因为验证码通常需要图像识别或人工输入。但是,您可以结合其他库来实现验证码的处理。
对于图像识别,您可以使用Tesseract OCR库(pytesseract)来识别简单的文字型验证码。对于需要人工输入的验证码,您可以在程序中添加一个提示框,让用户输入验证码后继续执行。
以下是一个简单的示例,展示如何使用requests和pytesseract处理文字型验证码:
- 首先,安装所需库:
pip install requests pytesseract pillow
- 然后,编写代码:
import requests from PIL import Image from io import BytesIO import pytesseract # 获取验证码图片 url = 'https://example.com/captcha' response = requests.get(url) image = Image.open(BytesIO(response.content)) # 使用Tesseract OCR识别验证码 captcha_text = pytesseract.image_to_string(image) # 输出识别结果 print('验证码文字:', captcha_text)
请注意,这个示例仅适用于简单的文字型验证码。对于其他类型的验证码,您可能需要尝试其他方法,如使用机器学习模型进行识别或使用第三方验证码识别服务。