是的,Python3 爬虫可以定时执行。您可以使用任务调度库(如 APScheduler 或 Celery)或者操作系统的定时任务(如 cron)来实现定时执行爬虫。
以下是两种实现方法的简要说明:
- 使用 APScheduler 库:
APScheduler 是一个轻量级、可扩展的任务调度库,可以很容易地集成到您的 Python 项目中。以下是一个简单的示例:
from apscheduler.schedulers.blocking import BlockingScheduler import requests def crawl(): response = requests.get('https://example.com') print(response.text) scheduler = BlockingScheduler() scheduler.add_job(crawl, 'interval', minutes=10) scheduler.start()
这个示例将每隔 10 分钟执行一次 crawl
函数。
- 使用操作系统的定时任务(如 cron):
您可以在操作系统中设置定时任务,以便定期运行 Python 脚本。以下是在 Linux 和 Windows 上设置定时任务的简要说明:
-
Linux(使用 cron):
- 打开终端。
- 输入
crontab -e
以编辑 cron 任务。 - 在文件末尾添加一行,表示定时执行的时间和要执行的命令。例如,每天凌晨 1 点执行
python3 /path/to/your/script.py
:0 1 * * * python3 /path/to/your/script.py
- 保存文件并退出编辑器。
-
Windows(使用任务计划程序):
- 打开任务计划程序。
- 单击右侧的“创建基本任务”。
- 为任务指定名称和描述,然后单击“下一步”。
- 选择任务的触发器(例如,每天),然后单击“下一步”。
- 设置任务的开始时间和重复间隔,然后单击“下一步”。
- 选择“启动程序”作为操作,然后单击“下一步”。
- 浏览并选择您的 Python 解释器(例如,
C:\Python39\python.exe
),然后单击“下一步”。 - 在“添加参数”框中输入您的脚本路径,例如:
C:\path\to\your\script.py
。单击“下一步”。 - 查看任务设置,然后单击“完成”。
这样,您就可以实现 Python3 爬虫的定时执行了。