是的,Python 网页爬虫可以抓取视频。可以使用第三方库如 requests
和 BeautifulSoup
来下载和解析网页,然后使用 ffmpeg
等工具将视频保存到本地。
以下是一个简单的示例代码,展示如何使用 Python 抓取网页上的视频并保存到本地:
import requests from bs4 import BeautifulSoup import re import os import subprocess def download_video(url, output_path): response = requests.get(url) with open(output_path, 'wb') as f: f.write(response.content) def extract_video_url(html): soup = BeautifulSoup(html, 'html.parser') video_tags = soup.find_all('video') video_urls = [] for tag in video_tags: source_tag = tag.find('source') if source_tag: video_url = source_tag.get('src') if video_url: video_urls.append(video_url) return video_urls def main(): url = 'https://example.com' # 替换为目标网页的 URL output_directory = 'videos' if not os.path.exists(output_directory): os.makedirs(output_directory) html = requests.get(url).text video_urls = extract_video_url(html) for i, video_url in enumerate(video_urls): output_path = os.path.join(output_directory, f'video_{i}.mp4') download_video(video_url, output_path) print(f'Downloaded {video_url} to {output_path}') if __name__ == '__main__': main()
请注意,这个示例代码仅适用于简单的网页结构,并且假设视频 URL 直接包含在 标签的
src
属性中。对于更复杂的网页结构,可能需要进一步解析和提取视频 URL。此外,ffmpeg
需要安装在系统中,以便将视频文件保存到本地。