快精灵印艺坊 您身边的文印专家
广州名片 深圳名片 会员卡 贵宾卡 印刷 设计教程
产品展示 在线订购 会员中心 产品模板 设计指南 在线编辑
 首页 名片设计   CorelDRAW   Illustrator   AuotoCAD   Painter   其他软件   Photoshop   Fireworks   Flash  

 » 彩色名片
 » PVC卡
 » 彩色磁性卡
 » 彩页/画册
 » 个性印务
 » 彩色不干胶
 » 明信片
   » 明信片
   » 彩色书签
   » 门挂
 » 其他产品与服务
   » 创业锦囊
   » 办公用品
     » 信封、信纸
     » 便签纸、斜面纸砖
     » 无碳复印纸
   » 海报
   » 大篇幅印刷
     » KT板
     » 海报
     » 横幅

提取HTML代码中文字的C#函数

 

/// <summary>
  /// 去除HTML标记
  /// </summary>
  /// <param name=\"strHtml\">包括HTML的源码 </param>
  /// <returns>已经去除后的文字</returns>
  public static string StripHTML(string strHtml)
  {
   string [] aryReg ={
          @\"<script[^>]*?>.*?</script>\",

          @\"<(///s*)?!?((/w+:)?/w+)(/w+(/s*=?/s*(([\"\"\\\'])(//[\"\"\\\'tbnr]|[^/7])*?/7|/w+)|.{0})|/s)*?(///s*)?>\",
          @\"([/r/n])[/s]+\",
          @\"&(quot|#34);\",
          @\"&(amp|#38);\",
          @\"&(lt|#60);\",
          @\"&(gt|#62);\",
          @\"&(nbsp|#160);\",
          @\"&(iexcl|#161);\",
          @\"&(cent|#162);\",
          @\"&(pound|#163);\",
          @\"&(copy|#169);\",
          @\"&#(/d+);\",
          @\"-->\",
          @\"<!--.*/n\"
        
         };

   string [] aryRep = {
           \"\",
           \"\",
           \"\",
           \"/\"\",
           \"&\",
           \"<\",
           \">\",
           \" \",
           \"/xa1\",//chr(161),
           \"/xa2\",//chr(162),
           \"/xa3\",//chr(163),
           \"/xa9\",//chr(169),
           \"\",
           \"/r/n\",
           \"\"
          };

   string newReg =aryReg[0];
   string strOutput=strHtml;
   for(int i = 0;i<aryReg.Length;i++)
   {
    Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );
    strOutput = regex.Replace(strOutput,aryRep[i]);
   }

   strOutput.Replace(\"<\",\"\");
   strOutput.Replace(\">\",\"\");
   strOutput.Replace(\"/r/n\",\"\");


   return strOutput;
  }


返回类别: 教程
上一教程: .NET中的GAC
下一教程: ADO.NET对象的构造(7)_OleDbParameter(中)

您可以阅读与"提取HTML代码中文字的C#函数"相关的教程:
· 在.net中实现与ASP完全兼容的MD5算法(包括中文字符)
· 在.NET下编写中文代码程序
· 在设计期跟踪代码 (.NET)
· 面向过程的.NET(一工作代码)
· C/C++中利用空指针简化代码,提高效率
    微笑服务 优质保证 索取样品