如何使用Html敏捷包进行Html验证

本文关键字:Html 包进行 验证 何使用 | 更新日期: 2023-09-27 18:14:26

我正在使用HTML Agility Pack来验证我的HTML。下面是我使用的

public class MarkupErrors
{
    public string ErrorCode { get; set; }
    public string ErrorReason { get; set; }
}
public static List<MarkupErrors> IsMarkupValid(string html)
{
    var document = new HtmlAgilityPack.HtmlDocument();
    document.OptionFixNestedTags = true;
    document.LoadHtml(html);
    var parserErrors = new List<MarkupErrors>();
    foreach(var error in document.ParseErrors)
    {
        parserErrors.Add(new MarkupErrors
                             {
                                 ErrorCode = error.Code.ToString(),
                                 ErrorReason = error.Reason
                             });
    }
    return parserErrors;
}

假设我的输入是如下所示的:

<h1>Test</h1> 
Hello World</h2> 
<h3>Missing close h3 tag

所以我的当前函数返回以下错误列表

- Start tag <h2> was not found
- End tag </h3> was not found

我的问题是,我希望整个html是有效的,那是一个适当的<head><body>标签,因为这个html稍后将可用于预览,下载为。html文件。

所以我想知道我是否可以使用HTML敏捷包检查这个?

任何想法或其他选择将不胜感激。由于

如何使用Html敏捷包进行Html验证

可以检查HTML元素下是否有HEAD元素或BODY元素,例如:

bool hasHead = doc.DocumentNode.SelectSingleNode("html/head") != null;
bool hasBody = doc.DocumentNode.SelectSingleNode("html/body") != null;

如果没有HTML元素,或者HTML元素下没有BODY元素,这些将失败。

注意,我没有使用这种XPATH表达式"//head",因为即使头部不是直接在HTML元素下,它也会给出结果。