QueryList 是一个 PHP 的网络爬虫库,它支持多种选择器来提取和操作 HTML 元素。以下是一些常用的选择器:
- CSS 选择器:QueryList 支持大多数 CSS 选择器,如类名(class)、ID、属性(attribute)、伪类(pseudo-class)等。例如:
// 通过类名选择元素 $elements = $ql->find('.className'); // 通过 ID 选择元素 $elements = $ql->find('#elementId'); // 通过属性选择元素 $elements = $ql->find('[href]'); // 通过伪类选择元素 $elements = $ql->find('.className:hover');
- XPath 选择器:QueryList 也支持 XPath 选择器,可以用来提取和操作 HTML 元素。例如:
// 通过 XPath 选择元素 $elements = $ql->findXPath('//div[@class="className"]');
- 组合选择器:QueryList 支持使用逗号分隔的选择器列表,可以用来组合多个选择器。例如:
// 使用组合选择器 $elements = $ql->find('.className, #elementId');
- 通配符选择器:QueryList 支持使用通配符
*
来选择所有元素。例如:
// 选择所有元素 $elements = $ql->find('*');
- 属性选择器:QueryList 支持使用方括号
[]
来选择具有指定属性的元素。例如:
// 选择具有指定属性的元素 $elements = $ql->find('[href^="https://"]');
- 伪类选择器:QueryList 支持使用冒号
:
来选择具有指定伪类的元素。例如:
// 选择第一个匹配的元素 $elements = $ql->find('div:first-child');
这些选择器可以组合使用,以满足不同的提取需求。更多详细信息和示例,请参考 QueryList 的官方文档:https://querylist.org/