将无效字符解析为 XML
本文关键字:XML 无效 字符 | 更新日期: 2023-09-27 18:31:22
应用思路很简单,应用被赋予一个路径,并且应用将每个文件的路径写入XML,我面临的问题是文件名可以有无效的字符,这会使应用程序停止工作,这是我用来将文件信息解析为XML的代码:
// the collecting details method
private void Get_Properties(string path)
{
// Load the XML File
XmlDocument xml = new XmlDocument();
xml.Load("Details.xml");
foreach (string eachfile in Files)
{
try
{
FileInfo Info = new FileInfo(eachfile);
toolStripStatusLabel1.Text = "Adding : " + Info.Name;
// Create the Root element
XmlElement ROOT = xml.CreateElement("File");
if (checkBox1.Checked)
{
XmlElement FileName = xml.CreateElement("FileName");
FileName.InnerText = Info.Name;
ROOT.AppendChild(FileName);
}
if (checkBox2.Checked)
{
XmlElement FilePath = xml.CreateElement("FilePath");
FilePath.InnerText = Info.FullName;
ROOT.AppendChild(FilePath);
}
if (checkBox3.Checked)
{
XmlElement ModificationDate = xml.CreateElement("ModificationDate");
string lastModification = Info.LastAccessTime.ToString();
ModificationDate.InnerText = lastModification;
ROOT.AppendChild(ModificationDate);
}
if (checkBox4.Checked)
{
XmlElement CreationDate = xml.CreateElement("CreationDate");
string Creation = Info.CreationTime.ToString();
CreationDate.InnerText = Creation;
ROOT.AppendChild(CreationDate);
}
if (checkBox5.Checked)
{
XmlElement Size = xml.CreateElement("Size");
Size.InnerText = Info.Length.ToString() + " Bytes";
ROOT.AppendChild(Size);
}
xml.DocumentElement.InsertAfter(ROOT, xml.DocumentElement.LastChild);
// +1 step in progressbar
toolStripProgressBar1.PerformStep();
success_counter++;
Thread.Sleep(10);
}
catch (Exception ee)
{
toolStripProgressBar1.PerformStep();
error_counter++;
}
}
toolStripStatusLabel1.Text = "Now Writing the Details File";
xml.Save("Details.xml");
toolStripStatusLabel1.Text = success_counter + " Items has been added and "+ error_counter +" Items has Failed , Total Files Processed ("+Files.Count+")";
Files.Clear();
}
以下是生成详细信息后 XML 的外观:
<?xml version="1.0" encoding="utf-8"?>
<Files>
<File>
<FileName>binkw32.dll</FileName>
<FilePath>D:'ALL DLLS'binkw32.dll</FilePath>
<ModificationDate>3/31/2012 5:13:56 AM</ModificationDate>
<CreationDate>3/31/2012 5:13:56 AM</CreationDate>
<Size>286208 Bytes</Size>
</File>
<File>
我想毫无问题地解析为 XML 的字符示例:
BX]GC^O^_nI_C{jv_rbp&1b_H âo&psolher d) doိiniᖭ
icon_Áq偩侉₳㪏ံ ぞ鵃_䑋屡1]
MAnaFor줡
编辑 [问题已解决]
我所要做的就是:1-将文件名转换为UTF8字节2-将UTF8字节转换回字符串
这是方法:
byte[] FilestoBytes = System.Text.Encoding.UTF8.GetBytes(Info.Name);
string utf8 = System.Text.Encoding.UTF8.GetString(FilestoBytes);
不清楚你的哪些角色遇到了问题。只要您使用 XML API(而不是尝试自己直接写出 XML),您应该可以使用任何有效的文本(断开的代理项对可能会导致问题),但无效的是 Unicode 码位小于空格 (U+0020),除了制表符、回车符和换行符。它们根本不适合在 XML 中。
可能是 xml 格式不正确。XML 文件不能包含某些字符而不进行转义。例如,这是无效的:
<dummy>You & Me</dummy>
相反,您应该使用:
<dummy>You & Me</dummy>
XML 中的非法字符是 &、<和>(以及属性中的 " 或 ')和>
XML
中的非法字符是&,<和>(以及属性中的"或")和>
在Windows上的文件系统中,文件名中只能有&和'(<,>",文件名中不允许)
保存 XML 时,可以对这些字符进行转义。例如,您将需要&