`
liubaoshan
  • 浏览: 40780 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

java过滤html标签函数

阅读更多
public static String Html2Text(String inputString) {
            String htmlStr = inputString; //含html标签的字符串
                String textStr ="";
          java.util.regex.Pattern p_script;
          java.util.regex.Matcher m_script;
          java.util.regex.Pattern p_style;
          java.util.regex.Matcher m_style;
          java.util.regex.Pattern p_html;
          java.util.regex.Matcher m_html;
      
          try {
           String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> }
           String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> }
              String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式
         
              p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
              m_script = p_script.matcher(htmlStr);
              htmlStr = m_script.replaceAll(""); //过滤script标签

              p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
              m_style = p_style.matcher(htmlStr);
              htmlStr = m_style.replaceAll(""); //过滤style标签
         
              p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
              m_html = p_html.matcher(htmlStr);
              htmlStr = m_html.replaceAll(""); //过滤html标签
         
           textStr = htmlStr;
         
          }catch(Exception e) {
                   System.err.println("Html2Text: " + e.getMessage());
          }
      
          return textStr;//返回文本字符串
           }  
分享到:
评论
5 楼 ilterish 2013-03-14  
这的特别强啊。急事需要的时候很帮忙,谢谢。。     
4 楼 ok888 2013-03-14  
实在是太强大了……五体投地……%
3 楼 suu 2012-12-10  
还是很厉害的
2 楼 suu 2012-12-10  
script 标签 内容也过滤掉了
1 楼 lwkjob 2011-10-14  
谢谢 为什么没人评论呢

相关推荐

    JAVA上百实例源码以及开源项目源代码

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    JAVA上百实例源码以及开源项目

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java开源包11

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包6

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包9

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包4

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包101

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包5

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包8

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包10

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包3

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    Java语言基础下载

    Servlet过滤器 569 Servlet监听器 576 内容总结 579 独立实践 580 第二十九章: Jsp 技术 583 学习目标 583 JSP介绍 584 JSP语法 584 模板元素 588 指令元素 588 页面指令 588 标签库指令 593 脚本元素 593 动作元素...

    java开源包1

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java web 视频、电子书、源码(李兴华老师出版)

    16.4、Html标签 16.4.1、&lt;html:form&gt;标签 16.4.2、&lt;html:text&gt;与&lt;html:password&gt;标签 16.4.3、&lt;html:radio&gt;标签 16.4.5、&lt;html:textarea&gt;标签 16.4.6、&lt;html:hidden&gt;标签 16.4.7、按钮标签 16.4.8、...

    李兴华Java Web开发实战经典.pdf (高清版) Part1

    16.4、Html标签 16.4.1、&lt;html:form&gt;标签 16.4.2、&lt;html:text&gt;与&lt;html:password&gt;标签 16.4.3、&lt;html:radio&gt;标签 16.4.5、&lt;html:textarea&gt;标签 16.4.6、&lt;html:hidden&gt;...

    MLDN+李兴华+Java+Web开发实战经典.part3.rar )

    16.4、Html标签 16.4.1、&lt;html:form&gt;标签 16.4.2、&lt;html:text&gt;与&lt;html:password&gt;标签 16.4.3、&lt;html:radio&gt;标签 16.4.5、&lt;html:textarea&gt;标签 16.4.6、&lt;html:hidden&gt;标签 16.4.7、按钮标签 16.4.8、...

    李兴华Java Web开发实战经典(高清版) Part2

    16.4、Html标签 16.4.1、&lt;html:form&gt;标签 16.4.2、&lt;html:text&gt;与&lt;html:password&gt;标签 16.4.3、&lt;html:radio&gt;标签 16.4.5、&lt;html:textarea&gt;标签 16.4.6、&lt;html:hidden&gt;...

    李兴华 Java Web 开发实战经典_带源码_高清pdf 带书签 上

    16.4、Html标签 16.4.1、&lt;html:form&gt;标签 16.4.2、&lt;html:text&gt;与&lt;html:password&gt;标签 16.4.3、&lt;html:radio&gt;标签 16.4.5、&lt;html:textarea&gt;标签 16.4.6、&lt;html:hidden&gt;标签 ...

    java开源包2

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

    java开源包7

    GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以...

Global site tag (gtag.js) - Google Analytics