发布时间:2022-11-03 文章分类:编程知识 投稿人:王小丽 字号: 默认 | | 超大 打印

get="_blank">XML

官方文档:https://www.w3school.com.cn/xml/index.asp

1.为什么需要xml?

  1. 需求1:两个程序间进行数据通信?
  2. 需求2:给一台服务器,做一个配置文件,当服务器程序启动时,去读取它应当监听的端口号、还有连接数据库的用户名和密码
  3. spring中的IOC配置文件beans.xml,mybatis的xxxMapper.xml文件,tomcat的server.xml,web.xml文件
  4. xml能存储复杂的数据关系

xml技术用于解决什么问题?

2.xml语法

需求:使用idea创建Students.xml存储多个学生信息

<?xml version="1.0" encoding="UTF-8" ?>
<!--    1.xml:表示该文件的类型为xml
        2.version 表示版本
        3.encoding="UTF-8" 文件编码为UTF-8
        4.students:root元素/根元素,名字自己定义
        5.<student> </student>表示一个students的子元素,可以有多个
        6.id就是属性,name,age,gender是student元素的子元素
    -->
<students>
    <student id="100">
        <name>jack</name>
        <age>10</age>
        <gender>男</gender>
    </student>
    <student id="200">
        <name>Mary</name>
        <age>18</age>
        <gender>女</gender>
    </student>
</students>

2.1文档声明

<?xml version="1.0" encoding="UTF-8" ?>
  1. xml声明放在xml文档的第一行
  2. xml声明由以下几个部分组成:
    • version:文档符合xml1.0规范,我们学习1.0
    • encoding:文档字符编码,比如:utf-8

2.2元素

  1. 元素语法要求:
  1. xml元素指xml文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式
  1. 在很多时候,元素,节点,标签是相同的意思
  2. xml元素命名规则:
    • 区分大小写,例如:<P><p>是两个不同的标记
    • 不能以数字开头
    • 不能包含空格
    • 名称中间不能包含冒号:
    • 如果标签单词需要间隔,建议使用下划线

2.3属性

属性介绍:

  1. 属性值用双引号""或单引号''分隔(如果属性值中有单引号'',就用双引号""分隔,如过属性值中有双引号"",就用单引号''分隔)

  2. 一个元素可以用多个属性,它的基本格式为:<元素名 属性名="属性值">

  3. 特定的属性名称在同一个元素标记中只能出现一次

    即属性名称在同一个元素中不能重复

  4. 属性值不能包括&字符

2.4注释

  1. <!--这是一个注释-->
  2. 注释内容中不要出现 --
  3. 不要把注释放在标记中间。错误写法:<Name <!--the name-->>TOM</Name>
  4. 注释不能嵌套
  5. 可以在除标记以外的任何地方放注释

2.5CDATA节

有些内容不想让解析引擎执行,而是当做原始内容(普通文本)处理,可以使用CDATA括起来,CDATA节中的所有字符都会被当做简单文本,而不是xml标记

  1. 语法:

    <![CDATA[这里可以把你输入的字符原样显示,不会解析xml]]>
    
  2. 可以输入任意字符(除]]>外)

  3. 不能嵌套

例子

<?xml version="1.0" encoding="UTF-8" ?>
<students>
    <student>
        <code>
            <!--如果希望把某些字符串当做普通文本使用,就用CDATA括起来-->
            <![CDATA[
            <script data-compress=strip>
            function h(obj){
            alert("一段js代码");
            }
            </script>
            ]]>
        </code>
    </student>
</students>

3.转义字符

对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理

day08-XML

例子

<?xml version="1.0" encoding="UTF-8" ?>
<students>
    <student>
        <name>jack</name>
        <age>10</age>
        <gender>男</gender>
        <!--转义字符表示一些特殊的字符-->
        <resume>年龄&lt;&gt;&amp;</resume>
    </student>
</students>
  1. xml声明语句<?xml version="1.0" encoding="UTF-8" ?>
  2. 必须有且仅有一个根元素
  3. 标记区分大小写
  4. 属性值用引号
  5. 标记成对
  6. 空标记关闭
  7. 元素正确嵌套

4.DOM4j

4.1xml解析技术原理和介绍

  1. 不管是html文件还是xml文件,都是标记型文档,都可以使用w3c组织制定的dom技术来解析
  2. document对象表示的是整个文档(可以是html文档,也可以是xml文档)
  3. DOM 把 XML 文档作为树结构来查看。能够通过 DOM 树来访问所有元素。可以修改或删除它们的内容,并创建新的元素。元素,它们的文本,以及它们的属性,都被认为是节点
  1. dom解析技术是W3C组织制定的,而所有的编程语言都对这个解析技术使用了自己语言的特点进行实现。Java对dom技术解析也做了实现
  2. sun公司在JDK5版本对dom解析技术进行升级:SAX(Simple API for XML)解析,它是以类似事件机制通过回调告诉用户当前正在解析的内容。是一行一行地读取xml文件进行解析的,不会创建大量的dom对象。所以它在解析xml的时候,在性能上由于Dom解析

这两种技术已经过时,简单了解即可

  1. jdom在dom基础上进行了封装
  2. dom4j 又对 jdom进行了封装
  3. pull主要用在Android手机开发,跟sax非常类似,都是事件机制解析xml文件

4.2dom4j介绍

  1. dom4j是一个简单、灵活的开放源代码的库(用于解析/处理xml文件)。dom4j是由早期开发JDOM的人分离出来后独立开发的。

  2. 与JDOM不同的是,dom4j使用接口和抽象基类,虽然dom4j的API相对要复杂一些,但他提供了比JDOM更好的灵活性

  3. Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的dom4j

  4. 使用dom4j开发,需要下载dom4j对象的jar文件

    dom4j的jar包下载地址(内有使用案例):dom4j

官方api文档:Overview (dom4j 1.6.1 API)

4.3dom4j获得document对象的方式

开发dom4j要导入dom4j的jar包

DOM4j中,获得document对象的方式有三种:

  1. 读取XML文件,获得document对象

    SAXReader reader = new SAXReader();//创建一个解析器
    Document document = reader.read(new File("src/input.xml"));//XML Document
    
  2. 解析XML形式的文本,得到document对象

    String text = "<members></members>";//直接对一个字符串的xml文本进行解析
    Document document = DocumentHelper.parseText(text);
    
  3. 主动创建document对象

    Document document = DocumentHelper.createDocument();//创建根节点
    Element root = document.addElement("members");
    

下面只演示方式一的使用:读取XML文件,获得document对象

dom4j应用实例-读取XML文件,获得document对象

  1. 使用dom4j对students.xml文件进行增删改查

    • 重点讲解查询(遍历和指定查询)
    • xml增删改使用少,作为拓展,给出案例
  2. 引入dom4j的依赖的jar包

    day08-XML

  3. 在src文件下创建Dom4j_类以及students.xml文件

students.xml:

<?xml version="1.0" encoding="UTF-8" ?>
<students>
    <student id="01">
        <name>小龙女</name>
        <gender>女</gender>
        <age>16</age>
        <resume>古墓派掌门人</resume>
    </student>
    <student id="02">
        <name>欧阳锋</name>
        <gender>男</gender>
        <age>18</age>
        <resume>白驼山弟子</resume>
    </student>
</students>

Dom4j_.java:

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
import org.testng.annotations.Test;
import java.io.File;
public class Dom4j_ {
    /**
     * 演示如何加载xml文件
     */
    @Test
    public void loadXML() throws DocumentException {
        //得到一个解析器
        SAXReader reader = new SAXReader();
        //debug-->看看document对象的属性
        Document document = reader.read(new File("src/students.xml"));
        System.out.println(document);
    }
}
  1. 如下:在Document document=reader.read(new File("src/students.xml"));处打上断点:

    day08-XML

  2. 点击debug,点击step over,可以看到document对象,它代表整个文档。

    展开document对象,rootElement代表的就是students根元素

    day08-XML

  3. rootElement下面有一个content属性,content属性存储着所有的elementData

    day08-XML

  4. 点击elementData属性,可以看到该属性有5个对象:

    day08-XML

    和html-dom解析一样,这五个对象中有三个是换行符号\n,其余的两个才是根元素下面的子元素student

  5. 点击展开索引为1的元素对象(即student元素),可以看到该元素对象中又包含了9个对象,除了换行符之外,其余的对象就是student元素的子元素,name节点,gender节点,age节点和resume节点

    day08-XML

    day08-XML
    day08-XML

  6. 点击name节点,展开,即可看到name节点的值

    day08-XML

document对象的整体结构为:

day08-XML

1.方式一遍历

演示案例1:遍历xml指定元素

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.testng.annotations.Test;
import java.io.File;
import java.util.List;
public class Dom4j_ {
    /**
     * 遍历所有的student信息
     */
    @Test
    public void listStus() throws DocumentException {
        //得到一个解析器
        SAXReader reader = new SAXReader();
        Document document = reader.read(new File("src/students.xml"));
        //1.得到rootElement
        Element rootElement = document.getRootElement();
        //2.得到rootElement的student节点
        List<Element> students = rootElement.elements("student");
        System.out.println(students.size());//2
        for (Element student : students) {//student就是student节点/元素
            //获取student节点的name节点
            Element name = student.element("name");//因为name只有一个,这里用element方法
            Element age = student.element("age");
            Element gender = student.element("gender");
            Element resume = student.element("resume");
            System.out.println("学生信息=" + name.getText() + " " +
                    age.getText() + " " + gender.getText() + " " + resume.getText());
        }
    }
}

day08-XML

2.方式一查询

案例2:读取指定xml元素

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.testng.annotations.Test;
import java.io.File;
public class Dom4j_ {
    /**
     * 指定读取第一个学生的信息
     */
    @Test
    public void readOne() throws DocumentException {
        //得到一个解析器
        SAXReader reader = new SAXReader();
        Document document = reader.read(new File("src/students.xml"));
        //1.得到rootElement
        Element rootElement = document.getRootElement();
        //2.获取第一个学生
        Element student = (Element) rootElement.elements("student").get(0);
        //3.输出该学生的信息
        System.out.println("学生信息=" +
                student.element("name").getText() + " " +
                student.element("age").getText() + " " +
                student.element("gender").getText() + " " +
                student.element("resume").getText());
        //4.获取student元素的属性
        System.out.println("id="+student.attributeValue("id"));     
    }
}

day08-XML

3.方式一增删改