使用 Go 进行 XML 反序列化提取 HTML 图片链接|创客网

使用 go 进行 xml 反序列化提取 html 图片链接

本文介绍了如何使用 Go 语言解析 HTML 文档，并提取其中 <img> 标签的 src 属性值。我们将探讨使用 exp/html 包来解析 HTML 结构，并展示如何通过遍历节点树来定位目标属性，从而实现图片链接的提取。本文旨在为 Go 开发者提供一种解析 HTML 并提取特定信息的实用方法。

使用 exp/html 包解析 HTML 并提取图片链接

Go 语言的标准库并没有提供强大的 HTML 解析功能，但 exp/html 包提供了一种解析 HTML 的方式。虽然 exp/html 被标记为实验性，但它仍然可以用来解析简单的 HTML 结构。

以下是一个使用 exp/html 包从 HTML 字符串中提取 <img> 标签的 src 属性值的示例代码：

package main
import (
"fmt"
"strings"
"golang.org/x/net/html"
)
func main() {
htmlString := `<div><div><img src="https://www.php.cn/faq/hello.png"/></div></div>`
doc, err := html.Parse(strings.NewReader(htmlString))
if err != nil {
fmt.Println("Error parsing HTML:", err)
return
}
var f func(*html.Node)
f = func(n *html.Node) {
if n.Type == html.ElementNode && n.Data == "img" {
for _, a := range n.Attr {
if a.Key == "src" {
fmt.Println("Image Source:", a.Val)
return // 找到第一个 src 就返回
}
}
}
for c := n.FirstChild; c != nil; c = c.NextSibling {
f(c)
}
}
f(doc)
}

代码解释：

立即学习“前端免费学习笔记（深入）”；

导入必要的包： fmt 用于打印输出，strings 用于处理字符串，golang.org/x/net/html 用于解析 HTML。注意这里需要使用go get golang.org/x/net/html安装依赖。
HTML 字符串： 定义包含 <img> 标签的 HTML 字符串。
解析 HTML： 使用 html.Parse 函数将 HTML 字符串解析为 html.Node 类型的文档树。
递归函数 f： 定义一个递归函数 f，用于遍历文档树。
- 检查节点类型和标签名： 如果当前节点是元素节点（html.ElementNode）且标签名是 “img”，则遍历其属性。
- 查找 src 属性： 如果找到 src 属性，则打印其值并返回。
- 递归遍历子节点： 递归调用 f 函数遍历当前节点的所有子节点。
调用递归函数： 从文档根节点开始调用 f 函数。

运行结果：

Sudowrite

对用户最友好的AI写作工具

查看详情
Sudowrite

Image Source: hello.png

注意事项：

golang.org/x/net/html 包会根据 HTML5 规范构建完整的 HTML 树，因此可能包含 <html>、<head>、<body> 等标签。
上述代码使用递归方式遍历 HTML 树，适用于简单的 HTML 结构。对于复杂的 HTML 结构，可能需要更复杂的遍历逻辑。
如果 HTML 中存在多个 <img> 标签，上述代码只会提取第一个 src 属性值。如果需要提取所有 src 属性值，需要修改代码。
由于golang.org/x/net/html包的特性，对于不完整的HTML，可能会自动补全标签，因此在查找特定节点时，需要注意HTML的结构。

总结：

使用 golang.org/x/net/html 包可以方便地解析 HTML 文档，并通过遍历节点树来提取特定的信息，例如 <img> 标签的 src 属性值。这种方法适用于简单的 HTML 结构，对于复杂的 HTML 结构，可能需要更复杂的处理逻辑。此外，还可以考虑使用更强大的 HTML 解析库，例如 goquery，它提供了更方便的 CSS 选择器语法来定位 HTML 元素。

大家都在看：

Go ChromeDP 在打印到 pdf 期间忽略任何外部或内部 CSS，仅使用 html 文件中的 CSS
如何在Go语言中使用正则表达式提取CSS样式属性值
Golang学习之Web应用程序的CSS设计实践
使用 Go 进行 XML 反序列化提取 HTML 图片链接
从 XML 解码 HTML 图片链接：Go 语言实践教程

温馨提示： 本文最后更新于2025-09-17 16:31:51，某些文章具有时效性，若有错误或已失效，请在下方留言或联系在线客服。

文章版权声明 1 本网站名称： 创客网
2 本站永久网址：https://new.ie310.com
1 本文采用非商业性使用-相同方式共享 4.0 国际许可协议[CC BY-NC-SA]进行授权
2 本站所有内容仅供参考，分享出来是为了可以给大家提供新的思路。
3 互联网转载资源会有一些其他联系方式，请大家不要盲目相信，被骗本站概不负责！
4 本网站只做项目揭秘，无法一对一教学指导，每篇文章内都含项目全套的教程讲解，请仔细阅读。
5 本站分享的所有平台仅供展示，本站不对平台真实性负责，站长建议大家自己根据项目关键词自己选择平台。
6 因为文章发布时间和您阅读文章时间存在时间差，所以有些项目红利期可能已经过了，能不能赚钱需要自己判断。
7 本网站仅做资源分享，不做任何收益保障，创业公司上收费几百上千的项目我免费分享出来的，希望大家可以认真学习。
8 本站所有资料均来自互联网公开分享，并不代表本站立场，如不慎侵犯到您的版权利益，请联系79283999@qq.com删除。

本站资料仅供学习交流使用请勿商业运营，严禁从事违法，侵权等任何非法活动，否则后果自负！

THE END

后端教程建站教程
# css # html # go # node # html5

文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中
文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中
文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中	文字广告位招租中

114:13 服饰399-40奍拉夏贝尔轻羽绒服64亓拉夏贝尔轻羽绒服63

220:32 五丰原味奶雪糕，各一件10.6

3如何在CSS中实现边框平滑过渡_border属性动画技巧

415:38 直播间红包雨试试 4.01-4券盼盼家庭号薯片番茄味薯片100g，0.9，抵扣红包雨带走

514:25 吧里做电商的记得按实申报

610:08 领600-90券 Plus领9折补贴海澜之家各拍1件328亓三

热门广告位

使用 Go 进行 XML 反序列化提取 HTML 图片链接

使用 exp/html 包解析 HTML 并提取图片链接

大家都在看：

请登录后发表评论

114:13 服饰399-40奍 拉夏贝尔轻羽绒服64亓 拉夏贝尔轻羽绒服63

220:32 五丰原味奶雪糕，各一件10.6

3如何在CSS中实现边框平滑过渡_border属性动画技巧

415:38 直播间红包雨试试 4.01-4券盼盼家庭号薯片 番茄味薯片100g，0.9，抵扣红包雨带走

514:25 吧里做电商的记得按实申报

610:08 领600-90券 Plus领9折补贴 海澜之家各拍1件328亓 三

热门广告位

使用 Go 进行 XML 反序列化提取 HTML 图片链接

使用 exp/html 包解析 HTML 并提取图片链接

大家都在看：

请登录后发表评论

114:13 服饰399-40奍拉夏贝尔轻羽绒服64亓拉夏贝尔轻羽绒服63

415:38 直播间红包雨试试 4.01-4券盼盼家庭号薯片番茄味薯片100g，0.9，抵扣红包雨带走

610:08 领600-90券 Plus领9折补贴海澜之家各拍1件328亓三