加载 HTML
从 HTML 页面抓取数据。
|
加载 HTML 页面并将结果作为 Map 返回 |
此过程提供了一个非常方便的 API,用于使用 DOM、CSS 和类似 jQuery 的方法进行操作。它依赖于 jsoup 库。
CALL apoc.load.html(url, {name: <css/dom query>, name2: <css/dom query>}, {config}) YIELD value
结果是一个由 Map 表示的 DOM 元素流
结果是一个 Map,例如:
{name: <list of elements>, name2: <list of elements>}
配置
Config 参数是可选的,默认值为空 Map。
|
默认值:UTF-8 |
|
默认值:"",用于解析相对路径 |
|
默认值:false,若设为 true,则使用 HTML 字符串而非 URL 作为第一个参数 |
真实数据示例
以下示例使用 维基百科首页。
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"})
您将获得以下结果
CALL apoc.load.html("https://en.wikipedia.org/",{links:"link"})
您将获得以下结果
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"}, {charset: "UTF-8"})
您将获得以下结果