XML无效字符相信用过Xml组件的人大部分都遇到过,不知道在什么时候就会出现一个 Bad character 0x0B 的错误,通过我的不断努力,终于找到一个基本上可以排除所有Xml 无效字符的方法。至今还没有遇到过新的无效字符,而且中文字符也都可以保留。
以下为C#代码
- //过滤方法
- public static string FilterXmlErrorCode(string xml)
- {
- foreach (char c in xml)
- {
- if (!IsLegalXmlChar(c))
- {
- xml = xml.Replace(c.ToString(),"");
- }
- }
-
- return xml;
- }
-
- //xml 无效字符检查
- private static bool IsLegalXmlChar(int character)
- {
- return
- (
- character == 0x9 /* == '/t' == 9 */ ||
- character == 0xA /* == '/n' == 10 */ ||
- character == 0xD /* == '/r' == 13 */ ||
- (character >= 0x20 && character <= 0xD7FF) ||
- (character >= 0xE000 && character <= 0xFFFD) ||
- (character >= 0x10000 && character <= 0x10FFFF)
- );
- }
- string example = "xxxxx";
- example = FilterXmlErrorCode(example);
当然,这个方法会占用一些资源,尤其是字符串非常长的时候。如果可以catch到xml报错,也可以在catch住以后再进行过滤。