.NET(C#):XmlReader和Whitespace以及MoveToContent和ReadToFollowing方法

简介: 原文 http://www.cnblogs.com/mgen/archive/2012/04/26/2471403.html XmlReader默认是读取XML文件中的Whitespace和注释的。

原文 http://www.cnblogs.com/mgen/archive/2012/04/26/2471403.html

XmlReader默认是读取XML文件中的Whitespace和注释的。

比如这个XML:

<root>

    <!-- root中 -->

    <file>

       

        <file.attr>hidden</file.attr>

        a.txt

    </file>

</root>

 

XmlReader读取代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

    while (xr.Read())

        Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);

}

将会输出:

NodeType:XmlDeclaration       Name:xml

NodeType:Whitespace           Name:

NodeType:Element              Name:root

NodeType:Whitespace           Name:

NodeType:Comment              Name:

NodeType:Whitespace           Name:

NodeType:Element              Name:file

NodeType:Whitespace           Name:

NodeType:Element              Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file

NodeType:Whitespace           Name:

NodeType:EndElement           Name:root

可以看到,Whitespace和注释都被读了进来。

 

解决方案之一就是在XmlReaderSettings中将IgnoreWhitespace和IgnoreComments设置为True(默认当然是False),然后再创建XmlReader:

var xrs =newXmlReaderSettings();

xrs.IgnoreComments =true;

xrs.IgnoreWhitespace =true;

using (var xr =XmlReader.Create("data.xml", xrs))

{ }

 

还可以使用XmlReader的MoveToContent方法,可以参考MSDN的全面解释(http://msdn.microsoft.com/zh-cn/library/system.xml.xmlreader.movetocontent.aspx):

检查当前节点是否是内容(非空白文本、CDATA、Element、EndElement、EntityReference 或 EndEntity)节点。 如果此节点不是内容节点,则读取器向前跳至下一个内容节点或文件结尾。 它跳过以下类型的节点:ProcessingInstruction、DocumentType、Comment、Whitespace 或 SignificantWhitespace。

 

代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

    while (xr.Read())

    {

        xr.MoveToContent();

        Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);

    }

}

输出:

NodeType:Element              Name:root

NodeType:Element              Name:file

NodeType:Element              Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file

NodeType:EndElement           Name:root

Whitespace和注释都没了。

 

注意不要和XmlReader的两个其他的方法混淆:MoveToAttribute和MoveToElement,这两个是在XML元素和属性之间的移动。

另外许多XmlReader的读取操作内部会调用MoveToContent方法,比如ReadElementString,ReadStartElement,ReadEndElement……

 

第三个要说的方法是MoveToFollowing方法,这个方法会一直读下去直到指定名称的元素被找到。这样的话我们直接去找需要的节点而直接省略那些Whitespace或者注释。

代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

    //使用ReadToFollowing读至file.attr元素

    xr.ReadToFollowing("file.attr");

    Console.WriteLine(xr.ReadElementString());

    //读取元素内的XML文本

    Console.WriteLine(xr.ReadString().Trim());

}

输出:

hidden

a.txt

注意XML元素内的文字节点的Whitespace是始终保留的。

目录
相关文章
|
1月前
|
Java 调度 C#
C#学习系列相关之多线程(一)----常用多线程方法总结
C#学习系列相关之多线程(一)----常用多线程方法总结
|
1月前
|
C#
C#学习相关系列之数组---常用方法使用(二)
C#学习相关系列之数组---常用方法使用(二)
|
1月前
|
存储 C# 数据库
C# 生成唯一ID,有哪些方法?
【2月更文挑战第12天】
167 0
|
3月前
|
编译器 C# 开发者
C# 11.0中的新特性:覆盖默认接口方法
C# 11.0进一步增强了接口的灵活性,引入了覆盖默认接口方法的能力。这一新特性允许类在实现接口时,不仅可以提供接口中未实现的方法的具体实现,还可以覆盖接口中定义的默认方法实现。本文将详细介绍C# 11.0中接口默认方法覆盖的工作原理、使用场景及其对现有代码的影响,帮助开发者更好地理解和应用这一新功能。
|
3月前
|
安全 C# 开发者
C#中的默认接口方法:接口演化的新篇章
【1月更文挑战第11天】本文探讨了C# 8.0中引入的默认接口方法,这一特性允许在接口中定义具有默认实现的方法。文章介绍了默认接口方法的语法、使用场景,以及它们如何影响接口的设计和实现,同时讨论了默认接口方法带来的好处和潜在的陷阱。
|
4月前
|
缓存 C#
C# 操作路径(Path)类方法的使用与解析运行实例
C# 操作路径(Path)类方法的使用与解析运行实例
|
1月前
|
C#
C#学习相关系列之数据类型类----嵌套类和嵌套方法(三)
C#学习相关系列之数据类型类----嵌套类和嵌套方法(三)
|
1月前
|
开发框架 .NET C#
C#学习相关系列之Linq常用方法---排序(一)
C#学习相关系列之Linq常用方法---排序(一)
|
1月前
|
开发框架 .NET 编译器
C#学习相关系列之匿名方法和Lambda表达式
C#学习相关系列之匿名方法和Lambda表达式
|
1月前
|
C#
C#中保留小数点后N位的方法_kaic
C#中保留小数点后N位的方法_kaic