DOC4J插入表格与HTML

请先阅读以下资料
https://www.baeldung.com/docx4j
官网
官方论坛(挺有用的,大部分问题在这里都能检索到)

开始

添加maven依赖

<!-- https://mvnrepository.com/artifact/org.docx4j/docx4j -->
<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j</artifactId>
    <version>6.0.1</version>
</dependency>

我这边引入的是6.0.1版本的docx4j,而且并没有额外引入jaxb-api,目前没有发现有什么影响

插入HTML

一些基础的操作在baeldung的资料中已经有了,我就不再提及了,这里主要说明下如何将html文本插入到word中。

在段落中插入Html

public void insertHtml() {
        //  构建一个html内容
        String content = "<p style=\"color:red\">一段HTML</p>";
        String htmlStr = "<html><head><meta http-equiv=\"Content-Type\" content=\"text/html\"; charset=\"utf-8\"></head><body>" + content + "<p><br/></p></body></html>";
        
        WordprocessingMLPackage aPackage;
        try {
            //  创建一个临时文件
            File tempFile = File.createTempFile("test", ".docx");
            aPackage = WordprocessingMLPackage.createPackage();
            //  插入段落文本
            aPackage.getMainDocumentPart().addParagraphOfText("hello");
            //  插入HTML
            aPackage.getMainDocumentPart().addAltChunk(AltChunkType.Html, htmlStr.getBytes(Charsets.UTF_8));
            //  将构建的word内容保存到临时文件
            aPackage.save(tempFile);
        } catch (IOException | Docx4JException e) {
            e.printStackTrace();
        }
    }

结果:


image

在表格中插入Html

public void insertHtmlToTableCell() {
        //  构建一个html内容
        String content = "<p style=\"color:red\">一段HTML</p>";

        WordprocessingMLPackage aPackage;
        try {
            //  创建一个临时文件
            File tempFile = File.createTempFile("test", ".docx");
            aPackage = WordprocessingMLPackage.createPackage();
            MainDocumentPart mainDocumentPart = aPackage.getMainDocumentPart();
            mainDocumentPart.addStyledParagraphOfText("Title", "将HTML插入表格中");

            int rowsNum = 2;    //  生成表格的行数
            int columnNumber = 2;   //  生成表格的列数
            int writableWidthTwips = aPackage.getDocumentModel().getSections().get(0).getPageDimensions().getWritableWidthTwips();  //  文档的可写宽度

            //  创建表格对象
            Tbl tbl = TblFactory.createTable(rowsNum, columnNumber, writableWidthTwips / columnNumber);
            //  获取所有行对象
            List<Object> rows = tbl.getContent();
            setRowData(mainDocumentPart, rows, 0, "第一行", content);
            setRowData(mainDocumentPart, rows, 1, "第二行", content);
            //  将生成的表格插入到文档中
            mainDocumentPart.addObject(tbl);
            //  将构建的word内容保存到临时文件
            aPackage.save(tempFile);
        } catch (IOException | Docx4JException e) {
            e.printStackTrace();
        }
    }

    /**
     * 设置生成的教案word的行数据
     * @param mainDoc   MainDocumentPart对象
     * @param rows  创建的Tbl对象的所有行对象
     * @param rowIndex  操作的行的索引
     * @param label     第一列插入的内容
     * @param htmlContent   第二列插入的html内容(只需要核心html段就可以了)
     * @throws InvalidFormatException
     */
    private void setRowData(MainDocumentPart mainDoc, List<Object> rows, int rowIndex, String label, String htmlContent) throws InvalidFormatException {
        //  获取当前行
        Tr tr = (Tr) rows.get(rowIndex);
        //  获取所有列对象
        List<Object> cells = tr.getContent();
        Tc labelTc = (Tc) cells.get(0); //  label列
        Tc valueTc = (Tc) cells.get(1); //  content列

        //  设置label
        labelTc.getContent().add(createLabelP(label));
        //  设置content
        if (htmlContent != null) {
            /*
              这里需要格外注意:
              1. 必须额外加上<p><br/></p>,其中<br/>可为其它标签或非空内容,否则会导致生成的word有错误,无法打开
              2. 需要设置html的字符集,否则html内容在部分word版本或跨平台word中会出现中文乱码的情况
             */
            String contentStr = "<html><head><meta http-equiv=\"Content-Type\" content=\"text/html\"; charset=\"utf-8\"></head><body>" + htmlContent + "<p><br/></p></body></html>";
            //  创建并设置AlternativeFormatInputPart
            AlternativeFormatInputPart afiPart = new AlternativeFormatInputPart(new PartName("/hw" + rowIndex + ".html")); //CAUTION: each html part needs a new name!!
            afiPart.setBinaryData(contentStr.getBytes(Charsets.UTF_8));
            afiPart.setContentType(new ContentType("text/html"));
            //  创建CTAltChunk
            Relationship altChunkRel = mainDoc.addTargetPart(afiPart);
            CTAltChunk ac = Context.getWmlObjectFactory().createCTAltChunk();
            ac.setId(altChunkRel.getId());
            //  将ac写入第二列(前面的索引好像是指在哪个位置插入,具体自己查查吧~~~)
            valueTc.getContent().set(0, ac);
        }
    }

    /**
     * 创建普通的Label的样式配置
     * @param text  内容
     * @return  一个P节点
     */
    private P createLabelP(String text) {
        ObjectFactory factory = Context.getWmlObjectFactory();
        P p = factory.createP();
        R r = factory.createR();
        Text t = factory.createText();
        t.setValue(text);
        r.getContent().add(t);
        p.getContent().add(r);
        RPr rpr = factory.createRPr();
        BooleanDefaultTrue b = new BooleanDefaultTrue();
        rpr.setB(b);
        BooleanDefaultTrue caps = new BooleanDefaultTrue();
        rpr.setCaps(caps);
        Color green = factory.createColor();
        green.setVal("black");
        rpr.setColor(green);

        // 设置字体大小
        HpsMeasure size = new HpsMeasure();
        size.setVal(new BigInteger("18"));
        rpr.setSz(size);
        rpr.setSzCs(size);
        // 设置字体
        RFonts rFonts = rpr.getRFonts();
        if (rFonts==null) {
            rFonts = new RFonts();
            rpr.setRFonts(rFonts);
        }
        rFonts.setEastAsia("微软雅黑");

        r.setRPr(rpr);
        return p;
    }

结果:


image

一些坑

  1. 在插入HTML的时候,一定要是完整的html内容(以<html>节点开口)
  2. 需要设置html的字符集,否则html内容在部分word版本或跨平台word中会出现中文乱码的情况
  3. 当在表格中插入HTML内容时,最后在</body>节点之前再添加个节点,如:<p><br/></p>,不然可能会遇到生成的word错误,无法打开的情况(我就遇到过:当<body>节点中的内容仅为一个<table>节点时)
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,117评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,963评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,897评论 0 240
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,805评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,208评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,535评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,797评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,493评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,215评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,477评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,988评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,325评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,971评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,807评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,544评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,455评论 2 266

推荐阅读更多精彩内容

  • 概要 64学时 3.5学分 章节安排 电子商务网站概况 HTML5+CSS3 JavaScript Node 电子...
    阿啊阿吖丁阅读 8,618评论 0 3
  • 虽说Excel制表功能是超级强大,但是当我们在使用word制作文档时难免会用一些表格功能。其实一些不复杂的表格操作...
    Jeck_merlin阅读 3,373评论 1 28
  • 1、HTML介绍 1 2、Html和CSS的关系 HTML是网页内容的载体。内容就是网页制作者放在页面上想要让用户...
    夏沫xx阅读 1,284评论 0 8
  • 一,HTML语言的一般语法: 1,围堵标记:<>… 1)带属性的标记: … 2)无属性的标记:加粗 居中 标题 2...
    清水易蓝阅读 1,234评论 0 2
  • 学习目标: 了解常用浏览器 掌握WEB标准 理解标签语义化 掌握常用的排版标签 掌握常用的文本格式化图像链接等标签...
    淡淡疯阅读 1,221评论 0 3