成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

XML就是這么簡(jiǎn)單

yacheng / 594人閱讀

什么是XML?

XML:extensiable markup language 被稱作可擴(kuò)展標(biāo)記語(yǔ)言

XML簡(jiǎn)單的歷史介紹:

gml->sgml->html->xml

gml(通用標(biāo)記語(yǔ)言)–在不同的機(jī)器進(jìn)行通信的數(shù)據(jù)規(guī)范

sgml(標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言)

html(超文本標(biāo)記語(yǔ)言)

為什么我們需要使用XML呢?

①我們沒(méi)有XML這種語(yǔ)言之前,我們使用的是String作為兩個(gè)程序之間的通訊!現(xiàn)在問(wèn)題就來(lái)了,如果我們傳輸?shù)氖菐в嘘P(guān)系型結(jié)構(gòu)的數(shù)據(jù),String怎么表達(dá)呢?String對(duì)關(guān)系型數(shù)據(jù)不擅長(zhǎng),要是描述起來(lái)也難免會(huì)有歧義的時(shí)候!關(guān)系型數(shù)據(jù)如圖下所示:

HTML語(yǔ)言本身就有缺陷

標(biāo)記都是固定的,不能自定義。HTML語(yǔ)言中有什么標(biāo)記就只能用什么標(biāo)記

HTML標(biāo)簽本身就缺少含義(tr標(biāo)簽里面什么內(nèi)容都能放進(jìn)去,不規(guī)范!!)

HTML沒(méi)有實(shí)現(xiàn)真正的國(guó)際化

XML文件就解決了以上的問(wèn)題了,如果使用XML描述上述圖片的關(guān)系,是非常簡(jiǎn)單的!

    
    <中國(guó)>
        <北京>
            <海淀>
            <豐臺(tái)>
        
        <湖南>
            <長(zhǎng)沙>
            <岳陽(yáng)>
        
        <湖北>
            <武漢>
            <荊州>
        
    

XML文件還能使用瀏覽器打開(kāi):

我們可以發(fā)現(xiàn)XML是可以描述很復(fù)雜的數(shù)據(jù)關(guān)系的

XML的用途

①:配置文件(例子:Tomcat的web.xml,server.xml......),XML能夠非常清晰描述出程序之間的關(guān)系

②:程序間數(shù)據(jù)的傳輸,XML的格式是通用的,能夠減少交換數(shù)據(jù)時(shí)的復(fù)雜性!

③:充當(dāng)小型數(shù)據(jù)庫(kù),如果我們的數(shù)據(jù)有時(shí)候需要人工配置的,那么XML充當(dāng)小型的數(shù)據(jù)庫(kù)是個(gè)不錯(cuò)的選擇,程序直接讀取XML文件顯然要比讀取數(shù)據(jù)庫(kù)要快呢!

XML的技術(shù)架構(gòu)

XML被設(shè)計(jì)為“什么都不做”,XML數(shù)據(jù)或XML文檔只用于組織、存儲(chǔ)數(shù)據(jù),除此之外的數(shù)據(jù)生成、讀取、傳送、存取等等操作都與XML本身無(wú)關(guān)!

于是乎,想要操作XML,就需要用到XML之外的技術(shù)了

為XML定規(guī)則:現(xiàn)在一般使用DTD或Schema技術(shù),當(dāng)然了Schema技術(shù)更為先進(jìn)!

解析XML的數(shù)據(jù):一般使用DOM或者SAX技術(shù),各有各的優(yōu)點(diǎn)

提供樣式:XML一般用來(lái)存儲(chǔ)數(shù)據(jù)的,但設(shè)計(jì)者野心很大,也想用來(lái)顯示數(shù)據(jù)(但沒(méi)人用XML來(lái)顯示數(shù)據(jù)),就有了XSLT(eXtensiable Stylesheet Language Transformation)可擴(kuò)展樣式轉(zhuǎn)換語(yǔ)言

XML語(yǔ)法: 文檔聲明:

XML聲明放在XML的第一行

version----版本

encoding--編碼

standalone--獨(dú)立使用--默認(rèn)是no。standalone表示該xml是不是獨(dú)立的,如果是yes,則表示這個(gè)XML文檔時(shí)獨(dú)立的,不能引用外部的DTD規(guī)范文件;如果是no,則該XML文檔不是獨(dú)立的,表示可以引用外部的DTD規(guī)范文檔。

正確的文檔聲明格式,屬性的位置不能改變!

    
元素

首先在這里說(shuō)明一個(gè)概念:在XML中元素和標(biāo)簽指的是同一個(gè)東西!不要被不同的名稱所迷惑了!

元素中需要值得注意的地方

XML元素中的出現(xiàn)的空格和換行都會(huì)被當(dāng)做元素內(nèi)容進(jìn)行處理

每個(gè)XML文檔必須有且只有一個(gè)根元素

元素必須閉合

大小寫(xiě)敏感

不能交叉嵌套

不能以數(shù)字開(kāi)頭

看起來(lái)好像有很多需要值得注意的地方,其實(shí)只需要記?。?strong>XML的語(yǔ)法是規(guī)范的!不要隨意亂寫(xiě)!

屬性

屬性是作為XML元素中的一部分的,命名規(guī)范也是和XML元素一樣的!

    
    <中國(guó) name="china">

    

注釋

注釋和HTML的注釋是一樣的

    
CDATA

在編寫(xiě)XML文件時(shí),有些內(nèi)容可能不想讓解析引擎解析執(zhí)行,而是當(dāng)作原始內(nèi)容處理。遇到此種情況,可以把這些內(nèi)容放在CDATA區(qū)里,對(duì)于CDATA區(qū)域內(nèi)的內(nèi)容,XML解析程序不會(huì)處理,而是直接原封不動(dòng)的輸出

語(yǔ)法:

    
    
轉(zhuǎn)義字符

對(duì)于一些單個(gè)字符,若想顯示其原始樣式,也可以使用轉(zhuǎn)義的形式予以處理。

處理指令

處理指令,簡(jiǎn)稱PI (processing instruction)。處理指令用來(lái)指揮解析引擎如何解析XML文檔內(nèi)容。

例如:

在XML文檔中可以使用xml-stylesheet指令,通知XML解析引擎,應(yīng)用css文件顯示xml文檔內(nèi)容。

    

XML代碼:



    
    
    
    
        
            廣州
        
        
            深圳
        
    

CSS代碼:

    
    
    guangzhou{
        font-size: 40px;
    }

效果:

JDK中的XML API

①:JAXP(The Java API For XML Processing):主要負(fù)責(zé)解析XML

②:JAXB(Java Architecture for XML Binding):主要負(fù)責(zé)將XML映射為Java對(duì)象

什么是XML解析

前面XML章節(jié)已經(jīng)說(shuō)了,XML被設(shè)計(jì)為“什么都不做”,XML只用于組織、存儲(chǔ)數(shù)據(jù),除此之外的數(shù)據(jù)生成、讀取、傳送等等的操作都與XML本身無(wú)關(guān)!

XML解析就是讀取XML的數(shù)據(jù)!

XML解析方式

XML解析方式分為兩種:

①:dom(Document Object Model)文檔對(duì)象模型,是W3C組織推薦解析XML的一種方式

②:sax(Simple API For XML),它是XML社區(qū)的標(biāo)準(zhǔn),幾乎所有XML解析器都支持它!

XML解析操作

從上面的圖很容易發(fā)現(xiàn),應(yīng)用程序不是直接對(duì)XML文檔進(jìn)行操作的,而是由XML解析器對(duì)XML文檔進(jìn)行分析,然后應(yīng)用程序通過(guò)XML解析器所提供的DOM接口或者SAX接口對(duì)分析結(jié)果進(jìn)行操作,從而間接地實(shí)現(xiàn)了對(duì)XML文檔的訪問(wèn)!

常用的解析器和解析開(kāi)發(fā)包的關(guān)系如下所示

為什么有3種開(kāi)發(fā)包?

jaxp開(kāi)發(fā)包是JDK自帶的,不需要導(dǎo)入開(kāi)發(fā)包。

由于sun公司的jaxp不夠完善,于是就被研發(fā)了Jdom。XML解析如果使用Jdom,需要導(dǎo)入開(kāi)發(fā)包

dom4j是由于Jdom的開(kāi)發(fā)人員出現(xiàn)了分歧,dom4j由Jdom的一批開(kāi)發(fā)人員所研發(fā)。XML解析如果使用Jdom,需要導(dǎo)入開(kāi)發(fā)包【現(xiàn)在用dom4j是最多的!】

jaxp

雖然jaxp解析XML的性能以及開(kāi)發(fā)的簡(jiǎn)易度是沒(méi)有dom4j好,但是jaxp不管怎么說(shuō)都是JDK內(nèi)置的開(kāi)發(fā)包,我們是需要學(xué)習(xí)的

DOM解析操作
DOM解析是一個(gè)基于對(duì)象的API,它把XML的內(nèi)容加載到內(nèi)存中,生成與XML文檔內(nèi)容對(duì)應(yīng)的模型!當(dāng)解析完成,內(nèi)存中會(huì)生成與XML文檔的結(jié)構(gòu)與之對(duì)應(yīng)的DOM對(duì)象樹(shù),這樣就能夠根據(jù)樹(shù)的結(jié)構(gòu),以節(jié)點(diǎn)的形式對(duì)文檔進(jìn)行操作!

簡(jiǎn)單來(lái)說(shuō):DOM解析會(huì)把XML文檔加載到內(nèi)存中,生成DOM樹(shù)的元素都是以對(duì)象的形式存在的!我們操作這些對(duì)象就能夠操作XML文檔了!

下面這樣圖就能很好地說(shuō)明了,是怎么樣生成與XML文檔內(nèi)容對(duì)應(yīng)的DOM樹(shù)!

既然XML文檔的數(shù)據(jù)是帶有關(guān)系型的,那么生成的DOM樹(shù)的節(jié)點(diǎn)也是有關(guān)系的:

位于一個(gè)節(jié)點(diǎn)之上的節(jié)點(diǎn)是該節(jié)點(diǎn)的父節(jié)點(diǎn)(parent)

一個(gè)節(jié)點(diǎn)之下的節(jié)點(diǎn)是該節(jié)點(diǎn)的子節(jié)點(diǎn)(children)

同一層次,具有相同父節(jié)點(diǎn)的節(jié)點(diǎn)是兄弟節(jié)點(diǎn)(sibling)

一個(gè)節(jié)點(diǎn)的下一個(gè)層次的節(jié)點(diǎn)集合是節(jié)點(diǎn)后代(descendant)

父、祖父節(jié)點(diǎn)及所有位于節(jié)點(diǎn)上面的,都是節(jié)點(diǎn)的祖先(ancestor)

在DOM解析中有幾個(gè)核心的操作接口:

Document【代表整個(gè)XML文檔,通過(guò)Document節(jié)點(diǎn)可以訪問(wèn)XML文件中所有的元素內(nèi)容!】

Node【Node節(jié)點(diǎn)幾乎在XML操作接口中幾乎相當(dāng)于普通Java類的Object,很多核心接口都實(shí)現(xiàn)了它,在下面的關(guān)系圖可以看出!】

NodeList【代表著一個(gè)節(jié)點(diǎn)的集合,通常是一個(gè)節(jié)點(diǎn)中子節(jié)點(diǎn)的集合!】

NameNodeMap【表示一組節(jié)點(diǎn)和其唯一名稱對(duì)應(yīng)的一一對(duì)應(yīng)關(guān)系,主要用于屬性節(jié)點(diǎn)的表示(書(shū)上說(shuō)是核心的操作接口,但我好像沒(méi)用到!呃呃呃,等我用到了,我再來(lái)填坑?。?/p>

節(jié)點(diǎn)之間的關(guān)系圖:

有人可能會(huì)很難理解,為什么Document接口比Node接口還小,呃呃呃,我是這樣想的:一個(gè)Document由無(wú)數(shù)個(gè)Node組成,這樣我也能把Document當(dāng)成是Node呀!如果實(shí)在想不通:人家都這樣設(shè)計(jì)了,你有種就不用?。?!(開(kāi)玩笑的.....)

好的,不跟你們多bb,我們來(lái)使用一下Dom的方式解析XML文檔吧!

XML文檔代碼

    
    
        廣州
        深圳
        北京
        上海
    

根據(jù)XML解析的流程圖,我們先要獲取到解析器對(duì)象!


    public class DomParse {
    
        public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException {
    
            //API規(guī)范:需要用一個(gè)工廠來(lái)造解析器對(duì)象,于是我先造了一個(gè)工廠!
            DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
    
            //獲取解析器對(duì)象
            DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
    
            //獲取到解析XML文檔的流對(duì)象
            InputStream inputStream = DomParse.class.getClassLoader().getResourceAsStream("city.xml");
    
            //解析XML文檔,得到了代表XML文檔的Document對(duì)象!
            Document document = documentBuilder.parse(inputStream);
            
        }
    }

解析XML文檔的內(nèi)容用來(lái)干嘛?無(wú)非就是增刪改查遍歷,只要我們會(huì)對(duì)XML進(jìn)行增刪改查,那就說(shuō)明我們是會(huì)使用DOM解析的!

遍歷

我們?cè)賮?lái)看一下XML文檔的內(nèi)容,如果我們要遍歷該怎么做?

可能我們會(huì)有兩種想法

①:從XML文檔內(nèi)容的上往下看,看到什么就輸出什么!【這正是SAX解析的做法】

②:把XML文檔的內(nèi)容分成兩部分,一部分是有子節(jié)點(diǎn)的,一部分是沒(méi)有子節(jié)點(diǎn)的(也就是元素節(jié)點(diǎn)?。?。首先我們判斷是否為元素節(jié)點(diǎn),如果是元素節(jié)點(diǎn)就輸出,不是元素節(jié)點(diǎn)就獲取到子節(jié)點(diǎn)的集合,再判斷子節(jié)點(diǎn)集合中的是否是元素節(jié)點(diǎn),如果是元素節(jié)點(diǎn)就輸出,如果不是元素節(jié)點(diǎn)獲取到該子節(jié)點(diǎn)的集合....好的,一不小心就遞歸了...

我們來(lái)對(duì)XML文檔遍歷一下吧,為了更好地重用,就將它寫(xiě)成一個(gè)方法吧(也是能夠更好地用遞歸實(shí)現(xiàn)功能)!

    public class DomParse {
    
        public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException {
    
            //API規(guī)范:需要用一個(gè)工廠來(lái)造解析器對(duì)象,于是我先造了一個(gè)工廠!
            DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
    
            //獲取解析器對(duì)象
            DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
    
            //獲取到解析XML文檔的File對(duì)象
            InputStream inputStream = DomParse.class.getClassLoader().getResourceAsStream("city.xml");
    
            //解析XML文檔,得到了代表XML文檔的Document對(duì)象!
            Document document = documentBuilder.parse(inputStream);
    
            //把代表XML文檔的document對(duì)象傳遞進(jìn)去給list方法
            list(document);
    
        }
    
    
        //我們這里就接收Node類型的實(shí)例對(duì)象吧!多態(tài)!??!
        private static void list(Node node) {
    
            //判斷是否是元素節(jié)點(diǎn),如果是元素節(jié)點(diǎn)就直接輸出
            if (node.getNodeType() == Node.ELEMENT_NODE) {
                System.out.println(node.getNodeName());
            }
    
            //....如果沒(méi)有進(jìn)入if語(yǔ)句,下面的肯定就不是元素節(jié)點(diǎn)了,所以獲取到子節(jié)點(diǎn)集合
            NodeList nodeList = node.getChildNodes();
    
            //遍歷子節(jié)點(diǎn)集合
            for (int i = 0; i < nodeList.getLength(); i++) {
    
                //獲取到其中的一個(gè)子節(jié)點(diǎn)
                Node child = nodeList.item(i);
    
                //...判斷該子節(jié)點(diǎn)是否為元素節(jié)點(diǎn),如果是元素節(jié)點(diǎn)就輸出,不是元素節(jié)點(diǎn)就再獲取到它的子節(jié)點(diǎn)集合...遞歸了
    
                list(child);
            }
            
        }
    }

效果:

查詢

現(xiàn)在我要做的就是:讀取guangzhou這個(gè)節(jié)點(diǎn)的文本內(nèi)容!


    private static void read(Document document) {

        //獲取到所有名稱為guangzhou節(jié)點(diǎn)
        NodeList nodeList = document.getElementsByTagName("guangzhou");
        
        //取出第一個(gè)名稱為guangzhou的節(jié)點(diǎn)
        Node node = nodeList.item(0);
        
        //獲取到節(jié)點(diǎn)的文本內(nèi)容
        String value = node.getTextContent();

        System.out.println(value);

    }

效果:

增加

現(xiàn)在我想多增加一個(gè)城市節(jié)點(diǎn)(杭州),我需要這樣做:

    private static void add(Document document) {

        //創(chuàng)建需要增加的節(jié)點(diǎn)
        Element element = document.createElement("hangzhou");

        //向節(jié)點(diǎn)添加文本內(nèi)容
        element.setTextContent("杭州");

        //得到需要添加節(jié)點(diǎn)的父節(jié)點(diǎn)
        Node parent = document.getElementsByTagName("china").item(0);

        //把需要增加的節(jié)點(diǎn)掛在父節(jié)點(diǎn)下面去
        parent.appendChild(element);

    }

做到這里,我僅僅在內(nèi)存的Dom樹(shù)下添加了一個(gè)節(jié)點(diǎn),要想把內(nèi)存中的Dom樹(shù)寫(xiě)到硬盤文件中,需要轉(zhuǎn)換器!

獲取轉(zhuǎn)換器也十分簡(jiǎn)單

        //獲取一個(gè)轉(zhuǎn)換器它需要工廠來(lái)造,那么我就造一個(gè)工廠
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        
        //獲取轉(zhuǎn)換器對(duì)象
        Transformer transformer = transformerFactory.newTransformer();

把內(nèi)存中的Dom樹(shù)更新到硬盤文件中的transform()方法就稍稍有些復(fù)雜了!

它需要一個(gè)Source實(shí)例對(duì)象和Result的實(shí)例對(duì)象,這兩個(gè)接口到底是什么玩意???

于是乎,我就去查API,發(fā)現(xiàn)DomSource實(shí)現(xiàn)了Source接口,我們使用的不正是Dom解析嗎,再看看構(gòu)造方法,感覺(jué)就是它了!

而SteamResult實(shí)現(xiàn)了Result接口,有人也會(huì)想,DomResult也實(shí)現(xiàn)了Result接口啊,為什么不用DomResult呢?我們現(xiàn)在做的是把內(nèi)存中的Dom樹(shù)更新到硬盤文件中呀,當(dāng)然用的是StreamResult啦!

完整代碼如下:

    private static void add(Document document) throws TransformerException {

        //創(chuàng)建需要增加的節(jié)點(diǎn)
        Element element = document.createElement("hangzhou");

        //向節(jié)點(diǎn)添加文本內(nèi)容
        element.setTextContent("杭州");

        //得到需要添加節(jié)點(diǎn)的父節(jié)點(diǎn)
        Node parent = document.getElementsByTagName("china").item(0);

        //把需要增加的節(jié)點(diǎn)掛在父節(jié)點(diǎn)下面去
        parent.appendChild(element);

        //獲取一個(gè)轉(zhuǎn)換器它需要工廠來(lái)造,那么我就造一個(gè)工廠
        TransformerFactory transformerFactory = TransformerFactory.newInstance();

        //獲取轉(zhuǎn)換器對(duì)象
        Transformer transformer = transformerFactory.newTransformer();

        //把內(nèi)存中的Dom樹(shù)更新到硬盤中
        transformer.transform(new DOMSource(document),new StreamResult("city.xml"));
    }

效果:

剛剛增加的節(jié)點(diǎn)是在china節(jié)點(diǎn)的末尾處的,現(xiàn)在我想指定增加節(jié)點(diǎn)的在beijing節(jié)點(diǎn)之前,是這樣做的:


    private static void add2(Document document) throws TransformerException {

        //獲取到beijing節(jié)點(diǎn)
        Node beijing = document.getElementsByTagName("beijing").item(0);

        //創(chuàng)建新的節(jié)點(diǎn)
        Element element = document.createElement("guangxi");

        //設(shè)置節(jié)點(diǎn)的文本內(nèi)容
        element.setTextContent("廣西");

        //獲取到要?jiǎng)?chuàng)建節(jié)點(diǎn)的父節(jié)點(diǎn),
        Node parent = document.getElementsByTagName("china").item(0);

        //將guangxi節(jié)點(diǎn)插入到beijing節(jié)點(diǎn)之前!
        parent.insertBefore(element, beijing);

        //將內(nèi)存中的Dom樹(shù)更新到硬盤文件中
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("city.xml"));
        
    }

效果:

刪除

現(xiàn)在我要?jiǎng)h除的是beijing這個(gè)節(jié)點(diǎn)!


    private static void delete(Document document) throws TransformerException {

        //獲取到beijing這個(gè)節(jié)點(diǎn)
        Node node = document.getElementsByTagName("beijing").item(0);

        //獲取到父節(jié)點(diǎn),然后通過(guò)父節(jié)點(diǎn)把自己刪除了
        node.getParentNode().removeChild(node);

        //把內(nèi)存中的Dom樹(shù)更新到硬盤文件中
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("city.xml"));


    }

效果:

修改

將guangzhou節(jié)點(diǎn)的文本內(nèi)容修改成廣州你好

    private static void update(Document document) throws TransformerException {

        //獲取到guangzhou節(jié)點(diǎn)
        Node node = document.getElementsByTagName("guangzhou").item(0);

        node.setTextContent("廣州你好");

        //將內(nèi)存中的Dom樹(shù)更新到硬盤文件中
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("city.xml"));


    }

效果:

操作屬性

XML文檔是可能帶有屬性值的,現(xiàn)在我們要guangzhou節(jié)點(diǎn)上的屬性

    private static void updateAttribute(Document document) throws TransformerException {

        //獲取到guangzhou節(jié)點(diǎn)
        Node node = document.getElementsByTagName("guangzhou").item(0);

        //現(xiàn)在node節(jié)點(diǎn)沒(méi)有增加屬性的方法,所以我就要找它的子類---Element
        Element guangzhou = (Element) node;

        //設(shè)置一個(gè)屬性,如果存在則修改,不存在則創(chuàng)建!
        guangzhou.setAttribute("play", "gzchanglong");

        //如果要?jiǎng)h除屬性就用removeAttribute()方法


        //將內(nèi)存中的Dom樹(shù)更新到硬盤文件中
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("city.xml"));


    }

效果:

SAX解析
SAX采用的是一種順序的模式進(jìn)行訪問(wèn),是一種快速讀取XML數(shù)據(jù)的方式。當(dāng)時(shí)候SAX解析器進(jìn)行操作時(shí),會(huì)觸發(fā)一系列事件SAX。采用事件處理的方式解析XML文件,利用 SAX 解析 XML 文檔,涉及兩個(gè)部分:解析器和事件處理器

sax是一種推式的機(jī)制,你創(chuàng)建一個(gè)sax 解析器,解析器在發(fā)現(xiàn)xml文檔中的內(nèi)容時(shí)就告訴你(把事件推給你). 如何處理這些內(nèi)容,由程序員自己決定。

當(dāng)解析器解析到聲明頭時(shí),會(huì)觸發(fā)事件。解析到元素頭時(shí)也會(huì)觸發(fā)事件!也就是說(shuō):當(dāng)使用SAX解析器掃描XML文檔(也就是Document對(duì)象)開(kāi)始、結(jié)束,以及元素的開(kāi)始、結(jié)束時(shí)都會(huì)觸發(fā)事件,根據(jù)不同事件調(diào)用相對(duì)應(yīng)的方法!

首先我們還是先拿到SAX的解析器再說(shuō)吧!

        //要得到解析器對(duì)象就需要造一個(gè)工廠,于是我造了一個(gè)工廠
        SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
        
        //獲取到解析器對(duì)象
        SAXParser saxParse = saxParserFactory.newSAXParser();

調(diào)用解析對(duì)象的解析方法的時(shí)候,需要的不僅僅是XML文檔的路徑!還需要一個(gè)事件處理器!

事件處理器都是由我們程序員來(lái)編寫(xiě)的,它一般繼承DefaultHandler類,重寫(xiě)如下5個(gè)方法:

    @Override
    public void startDocument() throws SAXException {
        super.startDocument();
    }

    @Override
    public void endDocument() throws SAXException {
        super.endDocument();
    }

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        super.startElement(uri, localName, qName, attributes);
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        super.endElement(uri, localName, qName);
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        super.characters(ch, start, length);
    }

獲取解析器,調(diào)用解析器解析XML文檔的代碼:


    public static void main(String[] args) throws Exception{

        //要得到解析器對(duì)象就需要造一個(gè)工廠,于是我造了一個(gè)工廠
        SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();

        //獲取到解析器對(duì)象
        SAXParser saxParse = saxParserFactory.newSAXParser();

        //獲取到XML文檔的流對(duì)象
        InputStream inputStream = SAXParse.class.getClassLoader().getResourceAsStream("city.xml");

        saxParse.parse(inputStream, new MyHandler());

    }

事件處理器的代碼:

    public class MyHandler extends DefaultHandler {
        @Override
        public void startDocument() throws SAXException {
            System.out.println("我開(kāi)始來(lái)掃描啦!?。?!");
        }
    
        @Override
        public void endDocument() throws SAXException {
    
            System.out.println("我結(jié)束了?。。?!");
        }
    
        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {

            //如果要解析出節(jié)點(diǎn)屬性的內(nèi)容,也非常簡(jiǎn)單,只要通過(guò)attributes變量就行了!

            //輸出節(jié)點(diǎn)的名字!
            System.out.println(qName);
        }
    
        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
    
            System.out.println(qName);
        }
    
        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
    
            System.out.println(new String(ch,start,length));
        }
    }

我們發(fā)現(xiàn),事件處理器的代碼都非常簡(jiǎn)單,然后就如此簡(jiǎn)單地就能夠遍歷整個(gè)XML文檔了!

如果要查詢多帶帶的某個(gè)節(jié)點(diǎn)的內(nèi)容也是非常簡(jiǎn)單的喲!只要在startElement()方法中判斷名字是否相同即可!

現(xiàn)在我只想查詢guangzhou節(jié)點(diǎn)的內(nèi)容:

    //定義一個(gè)標(biāo)識(shí)量,用于指定查詢某個(gè)節(jié)點(diǎn)的內(nèi)容
    boolean flag = false;

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {

        //如果節(jié)點(diǎn)名稱是guangzhou,我才輸出,并且把標(biāo)識(shí)量設(shè)置為true
        if (qName == "guangzhou") {
            System.out.println(qName);
            flag = true;
        }
    }


    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        //只有在flag為true的情況下我才輸出文本的內(nèi)容
        if (flag == true) {
            System.out.println(new String(ch, start, length));

        }
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {

        //在執(zhí)行到元素的末尾時(shí),不要忘了將標(biāo)識(shí)量改成false
        if (qName == "guangzhou" && flag == true) {
            System.out.println(qName);
            flag = false;

        }
    }

效果:

DOM和SAX解析的區(qū)別:

DOM解析讀取整個(gè)XML文檔,在內(nèi)存中形成DOM樹(shù),很方便地對(duì)XML文檔的內(nèi)容進(jìn)行增刪改。但如果XML文檔的內(nèi)容過(guò)大,那么就會(huì)導(dǎo)致內(nèi)存溢出!

SAX解析采用部分讀取的方式,可以處理大型文件,但只能對(duì)文件按順序從頭到尾解析一遍,不支持文件的增刪改操作

DOM和SAX解析有著明顯的差別,什么時(shí)候使用DOM或者SAX就非常明了了。

dom4j

Dom4j是一個(gè)非常優(yōu)秀的Java XML API,具有性能優(yōu)異、功能強(qiáng)大和極易使用的特點(diǎn)。

為什么需要有dom4j

dom缺點(diǎn):比較耗費(fèi)內(nèi)存

sax缺點(diǎn):只能對(duì)xml文件進(jìn)行讀取,不能修改,添加,刪除

dom4j:既可以提高效率,同時(shí)也可以進(jìn)行crud操作

因?yàn)閐om4j不是sun公司的產(chǎn)品,所以我們開(kāi)發(fā)dom4j需要導(dǎo)入開(kāi)發(fā)包

獲取dom4j的解析器

使用dom4j對(duì)XML文檔進(jìn)行增刪改查,都需要獲取到dom4j的解析器

        //獲取到解析器
        SAXReader saxReader = new SAXReader();

        //獲取到XML文件的流對(duì)象
        InputStream inputStream = DOM4j.class.getClassLoader().getResourceAsStream("1.xml");

        //通過(guò)解析器讀取XML文件
        Document document = saxReader.read(inputStream);
        
獲取Document對(duì)象

我們都知道,Document代表的是XML文檔,一般我們都是通過(guò)Document對(duì)象開(kāi)始,來(lái)進(jìn)行CRUD(增刪改查)操作的!

獲取Document對(duì)象有三種方式:

①:讀取XML文件,獲得document對(duì)象(這種最常用)

SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));

②:解析XML形式的文本,得到document對(duì)象

    
    String text = "";
    Document document=DocumentHelper.parseText(text);

③:主動(dòng)創(chuàng)建document對(duì)象.

Document document =DocumentHelper.createDocument();

//創(chuàng)建根節(jié)點(diǎn)
Element root = document.addElement("members");
CRUD的重要一句話:

讀取XML文檔的數(shù)據(jù),都是通過(guò)Document獲取根元素,再通過(guò)根元素獲取得到其他節(jié)點(diǎn)的,從而進(jìn)行操作!

如果XML的結(jié)構(gòu)有多層,需要一層一層地獲??!

查詢
    @Test
    public void read() throws DocumentException {

        //獲取到解析器
        SAXReader saxReader = new SAXReader();

        //獲取到XML文件的流對(duì)象
        InputStream inputStream = dom4j11.class.getClassLoader().getResourceAsStream("1.xml");
   
        //通過(guò)解析器讀取XML文件
        Document document = saxReader.read(inputStream);

        //獲取得到根節(jié)點(diǎn)
        Element root = document.getRootElement();

        //獲取得到name節(jié)點(diǎn)
        Element name = root.element("name");

        //得到了name節(jié)點(diǎn),就可以獲取name節(jié)點(diǎn)的屬性或者文本內(nèi)容了!
        String text = name.getText();

        String attribute = name.attributeValue("littleName");

        System.out.println("文本內(nèi)容是:" + text);
        System.out.println("屬性內(nèi)容是:" + attribute);
        
    }

XML文件如下:

    
         
        zhongfucheng
        20
    

效果:

多層結(jié)構(gòu)的查詢:

        //獲取得到根節(jié)點(diǎn)
        Element root = document.getRootElement();

        //一層一層地獲取到節(jié)點(diǎn)
        Element element = root.element("guangdong").element("guangzhou").element("luogang");

        String value = element.getText();

        System.out.println(value);

XML文件和結(jié)果:

增加

在DOM4j中要對(duì)內(nèi)存中的DOM樹(shù)寫(xiě)到硬盤文件中,也是要有轉(zhuǎn)換器的支持的!

dom4j提供了XMLWriter供我們對(duì)XML文檔進(jìn)行更新操作,一般地創(chuàng)建XMLWriter的時(shí)候我們都會(huì)給出兩個(gè)參數(shù),一個(gè)是Writer,一個(gè)是OutputFormat

這個(gè)OutputFormat有什么用的呢?其實(shí)就是指定回寫(xiě)XML的格式和編碼格式。細(xì)心的朋友會(huì)發(fā)現(xiàn),上面我們?cè)趈axp包下使用dom解析的Transformer類,把內(nèi)存中的DOM樹(shù)更新到文件硬盤中,是沒(méi)有格式的!不信倒回去看看!這個(gè)OutputFormat就可以讓我們更新XML文檔時(shí)也能帶有格式!

        //創(chuàng)建帶有格式的對(duì)象
        OutputFormat outputFormat = OutputFormat.createPrettyPrint();

        //設(shè)置編碼,默認(rèn)的編碼是gb2312,讀寫(xiě)的編碼不一致,會(huì)導(dǎo)致亂碼的!
        outputFormat.setEncoding("UTF-8");

        //創(chuàng)建XMLWriter對(duì)象
        XMLWriter xmlWriter = new XMLWriter(new FileWriter("2.xml"), outputFormat);

        //XMLWriter對(duì)象寫(xiě)入的是document
        xmlWriter.write(document);

        //關(guān)閉流
        xmlWriter.close();

下面我們就為在person節(jié)點(diǎn)下新創(chuàng)建一個(gè)name節(jié)點(diǎn)吧,完整的代碼如下:!


    @Test
    public void add() throws Exception {

        //獲取到解析器
        SAXReader saxReader = new SAXReader();

        //獲取到XML文件的流對(duì)象
        InputStream inputStream = dom4j11.class.getClassLoader().getResourceAsStream("1.xml");

        //通過(guò)解析器讀取XML文件
        Document document = saxReader.read(inputStream);

        //創(chuàng)建出新的節(jié)點(diǎn),為節(jié)點(diǎn)設(shè)置文本內(nèi)容
        Element newElement = DocumentHelper.createElement("name");
        newElement.setText("ouzicheng");

        //獲取到根元素
        Element root = document.getRootElement();

        //把新創(chuàng)建的name節(jié)點(diǎn)掛在根節(jié)點(diǎn)下面
        root.add(newElement);

        //創(chuàng)建帶有格式的對(duì)象
        OutputFormat outputFormat = OutputFormat.createPrettyPrint();

        //設(shè)置編碼,默認(rèn)的編碼是gb2312,讀寫(xiě)的編碼不一致,會(huì)導(dǎo)致亂碼的!
        outputFormat.setEncoding("UTF-8");

        //創(chuàng)建XMLWriter對(duì)象
        XMLWriter xmlWriter = new XMLWriter(new FileWriter("2.xml"), outputFormat);

        //XMLWriter對(duì)象寫(xiě)入的是document
        xmlWriter.write(document);

        //關(guān)閉流
        xmlWriter.close();


    }

效果如下,是有格式的

在指定的位置增加節(jié)點(diǎn)!現(xiàn)在我想的就是在age屬性前面添加節(jié)點(diǎn)!

        //創(chuàng)建一個(gè)新節(jié)點(diǎn)
        Element element = DocumentHelper.createElement("name");
        element.setText("ouzciheng");

        //獲取得到person下所有的節(jié)點(diǎn)元素!
        List list = document.getRootElement().elements();

        //將節(jié)點(diǎn)添加到指定的位置上
        list.add(1, element);

效果圖:

修改

XMLWriter和獲取Document對(duì)象的代碼我就不貼出來(lái)了,反正都是一樣的了!

        //獲取得到age元素
        Element age = document.getRootElement().element("age");
        age.setText("9999");

效果如下:

刪除

XMLWriter和獲取Document對(duì)象的代碼我就不貼出來(lái)了,反正都是一樣的了!

        //獲取得到age節(jié)點(diǎn)
        Element age = document.getRootElement().element("age");

        //得到age節(jié)點(diǎn)的父節(jié)點(diǎn),使用父節(jié)點(diǎn)的remove刪除age節(jié)點(diǎn)!
        age.getParent().remove(age);

效果:

XPATH 什么是XPATH
XPath 是一門在 XML 文檔中查找信息的語(yǔ)言。XPath 用于在 XML 文檔中通過(guò)元素和屬性進(jìn)行導(dǎo)航。
為什么我們需要用到XPATH

上面我們使用dom4j的時(shí)候,要獲取某個(gè)節(jié)點(diǎn),都是通過(guò)根節(jié)點(diǎn)開(kāi)始,一層一層地往下尋找,這就有些麻煩了!

如果我們用到了XPATH這門語(yǔ)言,要獲取得到XML的節(jié)點(diǎn),就非常地方便了!

快速入門

使用XPATH需要導(dǎo)入開(kāi)發(fā)包jaxen-1.1-beta-7,我們來(lái)看官方的文檔來(lái)入門吧。

XPATH的文檔非常國(guó)際化啊,連中文都有

XPATH文檔中有非常多的實(shí)例,非常好學(xué),對(duì)著來(lái)看就知道了!

我們來(lái)用XPATH技術(shù)讀取XML文件的信息吧,XML文檔如下:

之前,我們是先獲取根節(jié)點(diǎn),再獲取guangdong節(jié)點(diǎn)再獲取guangzhou節(jié)點(diǎn),然后才能讀取tianhe節(jié)點(diǎn)或者luogang節(jié)點(diǎn)的,下面我們來(lái)看一下使用XPATH可以怎么的便捷

        //直接獲取到luogang節(jié)點(diǎn)
        org.dom4j.Node node =  document.selectSingleNode("http://luogang");

        //獲取節(jié)點(diǎn)的內(nèi)容
        String value = node.getText();

        System.out.println(value);

效果:

獲取什么類型的節(jié)點(diǎn),XPATH的字符串應(yīng)該怎么匹配,查文檔就知道了,這里就不再贅述了。!

如果文章有錯(cuò)的地方歡迎指正,大家互相交流。習(xí)慣在微信看技術(shù)文章的同學(xué),可以關(guān)注微信公眾號(hào):Java3y

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/110367.html

相關(guān)文章

  • Tomcat就是這么簡(jiǎn)單

    摘要:什么是簡(jiǎn)單的說(shuō)就是一個(gè)運(yùn)行的網(wǎng)絡(luò)服務(wù)器,底層是的一個(gè)程序,它也是和的一個(gè)容器。在瀏覽器地址欄輸入如果能夠出現(xiàn)頁(yè)面,說(shuō)明配置成功了注意如果在使用時(shí)出現(xiàn)了很大原因就是和的版本不匹配。 什么是Tomcat Tomcat簡(jiǎn)單的說(shuō)就是一個(gè)運(yùn)行JAVA的網(wǎng)絡(luò)服務(wù)器,底層是Socket的一個(gè)程序,它也是JSP和Serlvet的一個(gè)容器。 為什么我們需要用到Tomcat 如果你學(xué)過(guò)html,css,...

    Winer 評(píng)論0 收藏0
  • Maven就是這么簡(jiǎn)單

    摘要:軟件項(xiàng)目的管理就會(huì)變得簡(jiǎn)單很多。比如說(shuō)的驅(qū)動(dòng)程序,,在是獲取不到的,就需要手工上傳到里是倉(cāng)庫(kù)組,在里沒(méi)有這個(gè)概念,是特有的。 什么是Maven Maven是一個(gè)采用純Java編寫(xiě)的開(kāi)源項(xiàng)目管理工具, Maven采用了一種被稱之為Project Object Model (POM)概念來(lái)管理項(xiàng)目,所有的項(xiàng)目配置信息都被定義在一個(gè)叫做POM.xml的文件中.. Maven是一款跨平臺(tái)的項(xiàng)目...

    leonardofed 評(píng)論0 收藏0
  • Java3y文章目錄導(dǎo)航

    摘要:前言由于寫(xiě)的文章已經(jīng)是有點(diǎn)多了,為了自己和大家的檢索方便,于是我就做了這么一個(gè)博客導(dǎo)航。 前言 由于寫(xiě)的文章已經(jīng)是有點(diǎn)多了,為了自己和大家的檢索方便,于是我就做了這么一個(gè)博客導(dǎo)航。 由于更新比較頻繁,因此隔一段時(shí)間才會(huì)更新目錄導(dǎo)航哦~想要獲取最新原創(chuàng)的技術(shù)文章歡迎關(guān)注我的公眾號(hào):Java3y Java3y文章目錄導(dǎo)航 Java基礎(chǔ) 泛型就這么簡(jiǎn)單 注解就這么簡(jiǎn)單 Druid數(shù)據(jù)庫(kù)連接池...

    KevinYan 評(píng)論0 收藏0
  • Spring【依賴注入】就是這么簡(jiǎn)單

    摘要:前言在的第二篇中主要講解了模塊的使用容器創(chuàng)建對(duì)象的問(wèn)題,模塊主要是解決對(duì)象的創(chuàng)建和對(duì)象之間的依賴關(guān)系,因此本博文主要講解如何使用容器來(lái)解決對(duì)象之間的依賴關(guān)系回顧以前對(duì)象依賴我們來(lái)看一下我們以前關(guān)于對(duì)象依賴,是怎么的歷程直接對(duì)象在最開(kāi)始,我們 前言 在Spring的第二篇中主要講解了Spring Core模塊的使用IOC容器創(chuàng)建對(duì)象的問(wèn)題,Spring Core模塊主要是解決對(duì)象的創(chuàng)建和...

    Lyux 評(píng)論0 收藏0
  • Spring AOP就是這么簡(jiǎn)單

    摘要:是一種特殊的增強(qiáng)切面切面由切點(diǎn)和增強(qiáng)通知組成,它既包括了橫切邏輯的定義也包括了連接點(diǎn)的定義。實(shí)際上,一個(gè)的實(shí)現(xiàn)被拆分到多個(gè)類中在中聲明切面我們知道注解很方便,但是,要想使用注解的方式使用就必須要有源碼因?yàn)槲覀円? 前言 只有光頭才能變強(qiáng) 上一篇已經(jīng)講解了Spring IOC知識(shí)點(diǎn)一網(wǎng)打盡!,這篇主要是講解Spring的AOP模塊~ 之前我已經(jīng)寫(xiě)過(guò)一篇關(guān)于AOP的文章了,那篇把比較重要的知...

    Jacendfeng 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<