将无效字符解析为 XML

本文关键字:XML 无效 字符 | 更新日期: 2023-09-27 18:31:22

应用思路很简单,应用被赋予一个路径,并且应用将每个文件的路径写入XML,我面临的问题是文件名可以有无效的字符,这会使应用程序停止工作,这是我用来将文件信息解析为XML的代码:

    // the collecting details method
    private void Get_Properties(string path)
    {
        // Load the XML File
        XmlDocument xml = new XmlDocument();
        xml.Load("Details.xml");
        foreach (string eachfile in Files)
        {
            try
            {
                FileInfo Info = new FileInfo(eachfile);
                toolStripStatusLabel1.Text = "Adding : " + Info.Name;
                // Create the Root element
                XmlElement ROOT = xml.CreateElement("File");
                if (checkBox1.Checked)
                {
                    XmlElement FileName = xml.CreateElement("FileName");
                    FileName.InnerText = Info.Name;
                    ROOT.AppendChild(FileName);
                }
                if (checkBox2.Checked)
                {
                    XmlElement FilePath = xml.CreateElement("FilePath");
                    FilePath.InnerText = Info.FullName;
                    ROOT.AppendChild(FilePath);
                }
                if (checkBox3.Checked)
                {
                    XmlElement ModificationDate = xml.CreateElement("ModificationDate");
                    string lastModification = Info.LastAccessTime.ToString();
                    ModificationDate.InnerText = lastModification;
                    ROOT.AppendChild(ModificationDate);
                }
                if (checkBox4.Checked)
                {
                    XmlElement CreationDate = xml.CreateElement("CreationDate");
                    string Creation = Info.CreationTime.ToString();
                    CreationDate.InnerText = Creation;
                    ROOT.AppendChild(CreationDate);
                }
                if (checkBox5.Checked)
                {
                    XmlElement Size = xml.CreateElement("Size");
                    Size.InnerText = Info.Length.ToString() + " Bytes";
                    ROOT.AppendChild(Size);
                }
                xml.DocumentElement.InsertAfter(ROOT, xml.DocumentElement.LastChild);
                // +1 step in progressbar
                toolStripProgressBar1.PerformStep();
                success_counter++;
                Thread.Sleep(10);
            }
            catch (Exception ee)
            {
                toolStripProgressBar1.PerformStep();
                error_counter++;
            }
        }
        toolStripStatusLabel1.Text = "Now Writing the Details File";
        xml.Save("Details.xml");
        toolStripStatusLabel1.Text = success_counter + " Items has been added and "+ error_counter +" Items has Failed , Total Files Processed ("+Files.Count+")";
        Files.Clear();
    }

以下是生成详细信息后 XML 的外观:

<?xml version="1.0" encoding="utf-8"?>
 <Files>
  <File>
    <FileName>binkw32.dll</FileName>
    <FilePath>D:'ALL DLLS'binkw32.dll</FilePath>
    <ModificationDate>3/31/2012 5:13:56 AM</ModificationDate>
    <CreationDate>3/31/2012 5:13:56 AM</CreationDate>
    <Size>286208 Bytes</Size>
  </File>
 <File>

我想毫无问题地解析为 XML 的字符示例:

BX]GC^O^_nI_C{jv_rbp&1b_H âo&psolher d) doိiniᖭ

icon_Áq偩侉₳㪏ံ ぞ鵃_䑋屡1]

MAnaFor줡

编辑 [问题已解决]

我所要做的就是:1-将文件名转换为UTF8字节2-将UTF8字节转换回字符串

这是方法:

byte[] FilestoBytes = System.Text.Encoding.UTF8.GetBytes(Info.Name);
string utf8 = System.Text.Encoding.UTF8.GetString(FilestoBytes);

将无效字符解析为 XML

不清楚你的哪些角色遇到了问题。只要您使用 XML API(而不是尝试自己直接写出 XML),您应该可以使用任何有效的文本(断开的代理项对可能会导致问题),但无效的是 Unicode 码位小于空格 (U+0020),除了制表符、回车符和换行符。它们根本不适合在 XML 中。

可能是 xml 格式不正确。XML 文件不能包含某些字符而不进行转义。例如,这是无效的:

<dummy>You & Me</dummy>

相反,您应该使用:

<dummy>You &amp; Me</dummy>

XML 中的非法字符是 &、<和>(以及属性中的 " 或 ')

XML

中的非法字符是&,<和>(以及属性中的"或")

在Windows上的文件系统中,文件名中只能有&和'(<,>",文件名中不允许)

保存 XML 时,可以对这些字符进行转义。例如,您将需要&amp;