java怎么读取xml

当前位置：首页 > 后端开发 > java怎么读取xml

详情介绍

va读取XML常用DOM、SAX或StAX解析器，如用DocumentBuilderFactory创建DOM对象遍历节点，或借助JAXB将 XML映射为Ja va对象

Java中读取XML文件有多种方式,具体取决于使用的库和个人偏好，以下是几种常见的方法及其详细步骤：

DOM解析（Document Object Model）

原理：将整个XML文档加载到内存中形成一个树形结构（节点树），开发者可以通过遍历这棵树来访问任意元素和属性，适合处理较小的XML文件。
实现步骤：
- 导入必要的包：需引入javax.xml.parsers、org.w3c.dom等相关类库。
- 创建DocumentBuilderFactory实例并设置命名空间意识等特性。
- 通过newDocumentBuilder()获取DocumentBuilder对象。
- 使用parse()方法解析输入流或文件得到Document对象。
- 利用getElementsByTagName(), getAttribute()等方法操作节点。

示例代码：

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;

public class DomExample {
public static void main(String[] args) throws Exception {
File file = new File(“example.xml”);
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(file);
doc.getDocumentElement().normalize();
NodeList nodeList = doc.getElementsByTagName(“book”);
for (int i = 0; i < nodeList.getLength(); i++) {
Node node = nodeList.item(i);
if (node instanceof Element) {
Element element = (Element) node;
System.out.println(“Title: ” + element.getElementsByTagName(“title”).item(0).getTextContent());
System.out.println(“Author: ” + element.getElementsByTagName(“author”).item(0).getTextContent());
}
}
}
}

java怎么读取xml 第1张

优缺点：优点是可以随机访问文档中的任何部分；缺点是如果XML很大，会消耗大量内存。
 SAX解析（Simple API for XML）
1. 原理：基于事件驱动模型，逐行读取XML文件并在遇到特定事件时触发相应的回调函数，适用于大型XML文件，因为它不会一次性加载全部内容到内存。
2. 实现步骤：
    创建DefaultHandler子类的实例，重写startElement(), endElement(), characters()等方法以响应不同事件。
    使用SAXParserFactory创建SAXParser对象。
    调用parse()方法开始解析过程。
3. 示例代码：
```java
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.InputStream;
public class SaxExample extends DefaultHandler {
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        System.out.println("Start Element: " + qName);
    }
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        System.out.println("Characters: " + new String(ch, start, length));
    }
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        System.out.println("End Element: " + qName);
    }
    public static void main(String[] args) throws Exception {
        SAXParserFactory factory = SAXParserFactory.newInstance();
        SAXParser saxParser = factory.newSAXParser();
        InputStream is = new FileInputStream("example.xml");
        saxParser.parse(is, new SaxExample());
        is.close();
    }
}

优缺点：优点是内存效率高，适合大文件；缺点是无法逆向导航，只能顺序处理。

StAX解析（Streaming API for XML）

原理：结合了DOM和SAX的优点，提供了一种拉取式的编程模型，允许程序员显式地控制解析过程，支持迭代器模式，能够按需读取数据片段。
实现步骤：
- 创建XMLInputFactory实例。
- 生成XMLStreamReader对象。
- 循环调用hasNext()和next()方法逐个处理事件。

示例代码：

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamReader;
import java.io.FileReader;

public class StAXExample {
public static void main(String[] args) throws Exception {
XMLInputFactory factory = XMLInputFactory.newInstance();
XMLStreamReader reader = factory.createXMLStreamReader(new FileReader(“example.xml”));
while (reader.hasNext()) {
int event = reader.next();
switch (event) {
case XMLStreamConstants.START_ELEMENT:
System.out.println(“Start Element: ” + reader.getLocalName());
break;
case XMLStreamConstants.CHARACTERS:
System.out.println(“Text Content: ” + reader.getText());
break;
case XMLStreamConstants.END_ELEMENT:
System.out.println(“End Element: ” + reader.getLocalName());
break;
}
}
}
}

java怎么读取xml 第2张

优缺点：优点是低延迟、高性能且灵活；缺点是需要手动管理状态转换逻辑。
 JDOM解析
1. 原理：这是一个第三方开源库，旨在简化Java中的XML操作，它提供了一个类似于DOM但更友好的API设计。
2. 实现步骤：
    添加JDOM依赖到项目中（如Maven仓库）。
    使用SAXBuilder构建文档对象。
    通过getRootElement(), getChildren()等方法进行导航和数据提取。
3. 示例代码：
```java
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.input.SAXBuilder;
import java.io.File;
public class JDOMExample {
    public static void main(String[] args) throws Exception {
        SAXBuilder saxBuilder = new SAXBuilder();
        Document document = saxBuilder.build(new File("example.xml"));
        Element rootElement = document.getRootElement();
        List<Element> books = rootElement.getChildren("book");
        for (Element book : books) {
            String title = book.getChildText("title");
            String author = book.getChildText("author");
            System.out.println("Title: " + title + ", Author: " + author);
        }
    }
}

优缺点：优点是API简洁易用；缺点是对复杂命名空间的支持不如原生DOM完善。

方法	适用场景	内存占用	功能特点	社区支持度
DOM	小型文件，需要频繁随机访问	高	树形结构，易于修改	广泛内置于JDK
SAX	超大型文件，流式处理	极低	事件驱动，单向顺序读取	标准API
StAX	中等规模，需要精细控制解析流程	较低	拉取模式，高性能	JSR 166规范
JDOM	追求开发效率与代码可读性平衡	中等偏高	类jQuery语法，学习曲线平缓	活跃的开源社区

常见问题FAQs

Q1: 如果XML文件非常大（比如几个GB），应该选用哪种解析方式？
A: 推荐使用SAX或StAX解析器，这两种都是基于流式的处理方式，不会一次性将整个文档加载到内存中，特别适合处理超大文件，其中SAX采用推模式（push），而StAX采用拉模式（pull），可根据具体需求选择。

Q2: 如何处理带有命名空间前缀的XML元素？
A: 在使用DOM/SAX/StAX时都需要特别注意命名空间的处理，例如在DOM中可以通过getNamespaceURI()判断元素的所属命名空间；在SAX中可通过Attributes对象的getQName()获取带前缀的名称；而在StAX中则可以使用getNamespaceContext().getPrefix(namespaceURI)来管理命名空间映射关系，对于JDOM，其API已经较好地封装了命名空间相关的细节，使用时相对

java怎么读取xml 第3张

va XML

java怎么读取xml

DOM解析（Document Object Model）

StAX解析（Streaming API for XML）

常见问题FAQs

为什么qq看点里的东西点不开

opc 怎么访问db区数据库

强势推荐

java怎么读取xml

DOM解析（Document Object Model）

StAX解析（Streaming API for XML）

常见问题FAQs

为什么qq看点里的东西点不开

opc 怎么访问db区数据库

相关文章

强势推荐