代码拉取完成,页面将自动刷新
#gumbo_src
简单的封装,主要用于习惯使用JS dom操作的童鞋们 可以应用于MAC、Linux、Windows。因为就是使用纯C写的,自然都可以使用。
直接把整个文件拷进去即可使用,如果想用动态库那么就编译安装(编译安装请搜索Google官方的Gumbo),直接使用:包含gumbo_ext.h/cpp即可
#include <iostream>
#include "gumbo_ext.h"
#define MY_HTML "<html>
<head></head> \
<body> \
<dt> \
<dd class=\"abc\" id=\"hanzi\">好的呢</dd> \
<dd class=\"abc\">192.168.1.119</dd> \
<dd class=\"address\">3e:4f:2c:8a:89</dd> \
</dt> \
</body> \
</html>"
int main(int argc, char *argv[])
{
std::string html = MY_HTML;
//****************************************************************
//使用前最好替换一些不需要的字符,如果 空格转义符号,没有什么影响最好替换掉
html.replace("\n","");
html.replace("\t","");
html.replace("\r","");
html.replace(" ","");
//****************************************************************
GumboOutput * output = gumbo_parse(html.c_str()); /* 解析 */
if(!output) return -1;
GumboNode * document = output->root;
GumboNodeList list = getElementsByTagName(document,"dd");
GumboNode * id = getElementById(document,"hanzi");
std::cout << getInnerText(id);
//继续使用其他方法...
gumbo_destroy_output(&kGumboDefaultOptions,output); /* 释放资源 */
return 0;
}
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。