05 xml 练习

1. 需求:从网页中读取一个表格的信息(dom方式)

Paste_Image.png

<b>网页源码</b>

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8"></meta>
    <title>Document</title>
    <style type="text/css">
        table{
            width: 400px;
            height: 100px;
            text-align: center;
            border: 1px solid #ffffff;
        }
        
        table td,table th{
            padding: 0px;
            margin: 0px;
            border: 1px solid;
        }
    </style>
</head>
<body>
    <table>
        <caption>学生信息表</caption>
        <thead>
            <tr>
                <th>name</th>
                <th>age</th>
                <th>sex</th>
                <th>tel</th>
                <th>address</th>
            </tr>
        </thead>
        <tbody>
            <tr>
                <td>丁昌江</td>
                <td>22</td>
                <td>男</td>
                <td>13247842137</td>
                <td>贵州</td>
            </tr>
            <tr>
                <td>杨燕语</td>
                <td>20</td>
                <td>女</td>
                <td>13323234523</td>
                <td>贵州</td>
            </tr>
        </tbody>
    </table>
</body>
</html>

<b>java代码</b>
Contact类

public class Contact {
    String name;
    int age;
    String sex;
    String tel;
    String address;
    
    public Contact(){
        super();
    }
    
    public Contact (String name,int age,String sex,String tel,String address){
        this.name=name;
        this.age=age;
        this.sex=sex;
        this.tel=tel;
        this.address=address;
    }
    
    @Override
    public String toString() {
        // TODO Auto-generated method stub
        return "\n姓名:"+this.name+" 年龄:"+this.age+" 性别:"+this.sex+" 电话:"+this.tel+" 地址:"+this.address;
    }

    public void setName(String name) {
        this.name = name;
    }

    public void setAge(int age) {
        this.age = age;
    }

    public void setSex(String sex) {
        this.sex = sex;
    }

    public void setTel(String tel) {
        this.tel = tel;
    }

    public void setAddress(String address) {
        this.address = address;
    }
}

测试类

public class demo01 {

    public static void main(String[] args) throws DocumentException {
        //创建一个List用来装联系人的信息
        List <Contact> contactList = new ArrayList <Contact>();
        //创建dom解析器
        SAXReader saxReader = new SAXReader();
        //读取xml文件
        Document doc = saxReader.read(new File("./src/contact.html"));
        //获取所有tr标签
        List <Element> trList = doc.selectNodes("//tbody//tr");
        //遍历标签且拿到标签的td元素
        for(Element td : trList){//一个tr标签也就相当于一个人的信息
            String name=td.selectSingleNode("td[1]").getText();
            int age = Integer.parseInt(td.selectSingleNode("td[2]").getText());
            String sex = td.selectSingleNode("td[3]").getText();
            String tel = td.selectSingleNode("td[4]").getText();
            String address = td.selectSingleNode("td[5]").getText();
            Contact contact = new Contact(name,age,sex,tel,address);
            contactList.add(contact);
        }
        
        System.out.println(contactList);
    }

}

<b>总结:</b>
这是事先知道td个数,Contact类属性的情况下写的,明显不智能有没有;
期待神级的html转对象工具(反射???)

2.需求:读取一个html文件且原样输出(dom方式)

测试类

public class demo03 {

    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        //创建SAXParser解析对象
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        //解析xml文件
        MyDefaultHandler2 default2 = new MyDefaultHandler2();
        parser.parse(new File("./src/contact.xml"),default2 );
        
        System.out.println(default2.getContent());
    }
}

MyDefaultHandler2

public class MyDefaultHandler2 extends DefaultHandler{
    //存储contact.xml文件信息
    //当contact.xml读取完毕之后,这个变量就有了所有xml文件信息
    private StringBuilder sb = new StringBuilder();
    
    public String getContent(){
        return sb.toString();
    }
    
    //开始标签
    /**
     * qName:开始标签的名称
     * attributes: 属性列表
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        sb.append("<"+qName);   //加上标签的<符号
        //属性列表
        if(attributes!=null){
            //遍历属性
            for(int i=0;i<attributes.getLength();i++){
                String name = attributes.getQName(i);//属性名称
                String value = attributes.getValue(i);//属性值
                sb.append(" "+name+"=\""+value+"\"");   //<contact id="01">
            }
        }
        sb.append(">"); //补上标签的>符号
    }
    
    //文本内容
    public void characters(char[] ch, int start, int length)
            throws SAXException {
        //当前文本内容
        String content = new String(ch,start,length);
        sb.append(content);
    }
    
    //结束标签
    //qName: 结束标签名称
    public void endElement(String uri, String localName, String qName)
            throws SAXException {
        sb.append("</"+qName+">");
    }
}

输出效果

Paste_Image.png

3.需求:从xml中读取对象信息(SAX方式)

测试类

public class demo04 {
    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        MyDefaultHandler3 dh = new MyDefaultHandler3();
        parser.parse(new File("./src/contact.xml"),dh);
        System.out.println(dh.getAllObject());
    }
}

MyDefaultHandler3

public class MyDefaultHandler3 extends DefaultHandler{
    String tmp = "";
    private Contact contact;
    List <Contact> contactList = new ArrayList<Contact>();
    //开始读取标签时
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        tmp = qName;
        if ("contact".equals(tmp)){
            contact = new Contact();
        }
    }
    //读取到标签内容时
    public void characters(char[] ch, int start, int length) throws SAXException {
        switch (tmp){
        case "name":
            contact.setName(new String(ch,start,length));
            break;
        case "age":
            contact.setAge(Integer.parseInt(new String(ch,start,length)));
            break;
        case "sex":
            contact.setSex(new String(ch,start,length));
            break;
        case "tel":
            contact.setTel(new String(ch,start,length));
            break;
        case "address":
            contact.setAddress(new String(ch,start,length));
            break;
        }
    }
    
    //读取到标签尾部时
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        //读取到尾部标签时,一定要让tmp为空,不然会把标签间的换行和空格添加到contact对象中
        if("contact".equals(qName)){
            contactList.add(contact);
        }else
            tmp = "";       
    }
    
    public List<Contact> getAllObject(){
        return contactList;
    }
}

contact类(同上)

效果:

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容

  • 一. Java基础部分.................................................
    wy_sure阅读 3,731评论 0 11
  • 1. XML总结 1.1. XML简介 XML : 可扩展的标记语言。(和HTML非常类似的) 可扩展的。 自定义...
    Ethan_Walker阅读 2,822评论 0 12
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,293评论 18 399
  • 问答题47 /72 常见浏览器兼容性问题与解决方案? 参考答案 (1)浏览器兼容问题一:不同浏览器的标签默认的外补...
    _Yfling阅读 13,629评论 1 92
  • 微信作为一种社交通讯工具已经超出了它原有的功能和意义,由于它使用非常简便,沟通快捷,而且还具有很多生活功能,所...
    太行山人武氏阅读 3,459评论 0 0