当前位置：首页 > 前端开发 > 正文

java如何反转义html

admin
前端开发
2025-08-09
20

Java中反转义HTML实体，可以使用Apache Commons Text库的 StringEscapeUtils.unescapeHtml4()方法。，“`java，import org.apache.commons.text.StringEscapeUtils;，String escapedHtml = “<div>Hello</div>”;，String unescapedHtml = StringEscapeUtils.unescapeHtml4(escapedHtml);，System.out.println(unescapedHtml);

Java中反转义HTML（即将HTML实体转换回相应的字符）可以通过多种方法实现,以下是几种常见的方法和详细的步骤说明：

使用Apache Commons Text库

Apache Commons Text是一个提供了一系列文本处理工具的库，其中包括HTML转义和反转义功能,使用这个库可以方便地实现HTML的反转义。

步骤：

添加依赖：需要在项目中添加Apache Commons Text的依赖，如果你使用的是Maven，可以在pom.xml中添加以下依赖：

<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-text</artifactId>
    <version>1.9</version>
</dependency>

编写代码：可以使用StringEscapeUtils类中的unescapeHtml4方法来反转义HTML实体。

import org.apache.commons.text.StringEscapeUtils;
public class HtmlUnescapeExample {
    public static void main(String[] args) {
        String escapedHtml = "&lt;div&gt;Hello World&lt;/div&gt;";
        String unescapedHtml = StringEscapeUtils.unescapeHtml4(escapedHtml);
        System.out.println(unescapedHtml); // 输出: <div>Hello World</div>
    }
}

使用JSP/Servlet内置函数

如果你在使用JSP或Servlet进行Web开发，可以利用JSP的内置函数fn:escapeXml和fn:unescapeXml来进行HTML的转义和反转义，需要注意的是，这些函数主要用于转义,反转义可能需要自定义实现。

示例代码：

java如何反转义html 第1张

<%@ taglib uri="http://java.sun.com/jsp/jstl/functions" prefix="fn" %>
<%
    String escapedHtml = "&lt;div&gt;Hello World&lt;/div&gt;";
    // 注意：JSTL没有直接的unescape函数，需要自定义或使用其他库
%>

由于JSTL没有直接的反转义函数，推荐使用Apache Commons Text或其他第三方库。

自定义实现反转义逻辑

如果不想引入第三方库，也可以自己实现一个简单的HTML反转义功能，这种方法适用于简单的场景,但对于复杂的HTML实体可能无法完全处理。

示例代码：

import java.util.HashMap;
import java.util.Map;
public class CustomHtmlUnescaper {
    private static final Map<String, String> htmlEntities = new HashMap<>();
    static {
        htmlEntities.put("&lt;", "<");
        htmlEntities.put("&gt;", ">");
        htmlEntities.put("&amp;", "&");
        htmlEntities.put("&quot;", """);
        htmlEntities.put("&#39;", "'");
        // 可以根据需要添加更多的实体
    }
    public static String unescapeHtml(String input) {
        String result = input;
        for (Map.Entry<String, String> entry : htmlEntities.entrySet()) {
            result = result.replace(entry.getKey(), entry.getValue());
        }
        return result;
    }
    public static void main(String[] args) {
        String escapedHtml = "&lt;div&gt;Hello &amp; Welcome&lt;/div&gt;";
        String unescapedHtml = unescapeHtml(escapedHtml);
        System.out.println(unescapedHtml); // 输出: <div>Hello & Welcome</div>
    }
}

注意事项：

这种方法只处理了常见的HTML实体，对于不常见的实体或数字实体（如©）需要额外处理。
对于复杂的HTML内容，建议使用成熟的库,以避免遗漏或错误处理。

使用Jsoup库

Jsoup是一个用于解析、清理和操作HTML的Java库，虽然它主要用于解析HTML文档,但也可以用于反转义HTML实体。

步骤：

添加依赖：在Maven项目中添加Jsoup的依赖。

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.15.3</version>
</dependency>

编写代码：使用Jsoup的parse方法解析HTML,并获取文本内容。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class JsoupHtmlUnescapeExample {
    public static void main(String[] args) {
        String escapedHtml = "&lt;div&gt;Hello World&lt;/div&gt;";
        Document doc = Jsoup.parse(escapedHtml);
        String unescapedHtml = doc.text();
        System.out.println(unescapedHtml); // 输出: Hello World
    }
}

注意：doc.text()会提取出纯文本内容，去除了HTML标签，如果需要保留HTML结构并反转义实体,可以结合其他方法使用。

方法比较

方法	优点	缺点
Apache Commons Text	简单易用，支持多种实体	需要添加第三方依赖
JSP/Servlet内置函数	无需额外依赖，适用于Web开发环境	缺乏直接的反转义函数，需自定义
自定义实现	无需第三方库，灵活性高	需要手动维护实体映射，处理复杂实体困难
Jsoup	强大的HTML解析能力，可同时处理结构和实体	主要针对HTML解析，单纯反转义可能过于复杂