webmagic匹配a标签的文本
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
在 WebMagic 中您可以使用 XPath 或 CSS 选择器来匹配 <a> 标签的文本。
使用 XPath
// 导入相关类
import us.codecraft.webmagic.selector.Html;
import us.codecraft.webmagic.selector.Selectable;
// 要解析的 HTML
String htmlContent = "<html><body><a href='https://xx.com'>Example</a></body></html>";
// 将 HTML 转换为可选项对象
Selectable selectable = new Html(htmlContent);
// 使用 XPath 选择器匹配 <a> 标签的文本
String linkText = selectable.xpath("//a/text()").get();
System.out.println("Link Text: " + linkText);
使用 CSS 选择器
// 导入相关类
import us.codecraft.webmagic.selector.Html;
import us.codecraft.webmagic.selector.Selectable;
// 要解析的 HTML
String htmlContent = "<html><body><a href='https://xx.com'>Example</a></body></html>";
// 将 HTML 转换为可选项对象
Selectable selectable = new Html(htmlContent);
// 使用 CSS 选择器匹配 <a> 标签的文本
String linkText = selectable.css("a::text").get();
System.out.println("Link Text: " + linkText);
上述代码示例中我们首先将要解析的 HTML 内容转换为可选项对象这里使用了 Html 类然后使用 XPath 或 CSS 选择器来匹配 <a> 标签的文本内容。xpath("//a/text()") 选择所有 <a> 标签的文本内容css("a::text") 使用 CSS 选择器选择 <a> 标签的文本内容。