首页 / HTML / 提取HTML代码中文字的C#函数

提取HTML代码中文字的C#函数

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了提取HTML代码中文字的C#函数，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1336字，纯文字阅读大概需要2分钟。

内容图文

/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="strHtml">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"<script[^>]*?>.*?</script>",

@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
          @"([\r\n])[\s]+",
          @"&(quot|#34);",
          @"&(amp|#38);",
          @"&(lt|#60);",
          @"&(gt|#62);",
          @"&(nbsp|#160);",
          @"&(iexcl|#161);",
          @"&(cent|#162);",
          @"&(pound|#163);",
          @"&(copy|#169);",
          @"&#(\d+);",
          @"-->",
          @"<!--.*\n"

         };

   string [] aryRep = {
           "",
           "",
           "",
           "\"",
           "&",
           "<",
           ">",
           " ",
           "\xa1",//chr(161),
           "\xa2",//chr(162),
           "\xa3",//chr(163),
           "\xa9",//chr(169),
           "",
           "\r\n",
           ""
          };

   string newReg =aryReg[0];
   string strOutput=strHtml;
   for(int i = 0;i<aryReg.Length;i++)
   {
    Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );
    strOutput = regex.Replace(strOutput,aryRep[i]);
   }

   strOutput.Replace("<","");
   strOutput.Replace(">","");
   strOutput.Replace("\r\n","");

return strOutput;
}

内容总结

以上是互联网集市为您收集整理的提取HTML代码中文字的C#函数全部内容，希望文章能够帮你解决提取HTML代码中文字的C#函数所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/381518.html

来源：【匿名】

【上一篇】ASP.NET技巧：请求网址并解析返回的html 【下一篇】PHP 和 HTML

更多 ►

【提取HTML代码中文字的C#函数】教程文章相关的互联网学习教程文章

省份、城市、区县三级联动Html代码

<!DOCTYPE html><html><head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script type="text/javascript" src="jquery-1.11.0.min.js"></script> <script type="text/javascript"> $(function(){ function objInit(obj){ return $(obj).html("<option>请选择</option>"); } var arrData = { 江西省:{宜春市: "袁州...

C# winform中读取HTML代码

这次的任务是在winform建立一个表格，表格第一列需要绑定数据，表格的第一行也需要绑定数据，而其他的单元格数据则是根据对应的行数据和列数据进行提取。询问过后，需要在后台拼接HTML代码实现这个功能。就我这个新手加菜鸟而言，winform如何去读取HTML代码都是一个问题。经过一个上午的努力，终于迈向了第一步——winform读取HTML代码并显示方法：用webBrowser控件去读取HTML，用webBrowser1.DocumentText属性显示。OK，其实的方法...

Dreamweaver如何格式化html代码【转载】【图】

草考文献：Dreamweaver如何格式化html代码我们在使用Dreamweaver进行网页制作时，通过编辑其设置中的代码格式，可以一键实现代码格式化，从而让代码格式统一，提高代码可读性。工具/原料 Dreamweaver CS6方法/步骤用Dreamweaver打开现有html文档时，可能会出现如图所示的没有任何缩进的代码，可读性很差为了格式化代码，我们可以先设置一下自己想要的代码格式。依次点击编辑 -> 首选参数；英文版则是 Edit -> Preferences 在弹...

颜色表及html代码

颜色名称及色样表(HTML版) 颜色名中文名称Hex RGB十进制 Decimal LightPink浅粉红#FFB6C1255,182,193 Pink粉红#FFC0CB255,192,203 Crimson深红(猩红)#DC143C220,20,60 LavenderBlush淡紫红#FFF0F5255,240,245 PaleVioletRed弱紫罗兰红#DB7093219,112,147 HotPink热情的粉红#FF69B4255,105,180 DeepPink深粉红#FF1493255,20,147 MediumVioletRed中紫罗兰红#C71585199,21,133 Orchid暗紫色(兰花紫)#DA70D6218,112,214 This...

div+css页面布局-html代码

<html><head><title>div+css页面布局</title><meta http-equiv="content-type" content="text/html" ><link rel="stylesheet" type="text/css" href="css/layout.css" /></head><body><div id="container"><div id="head"> <div id="logo"> </div> <div id="banner"> </div> <div id="tool"> </div> <div class="nav"> </div> <div id="menu"> <ul> <li><a href="#">公司概况</a></li> <li class="tiao"></li> ...

在线运行HTML代码器（一）【代码】

在线运行HTML代码：<!DOCTYPE html><html><head><meta charset="utf-8"><title>在线运行HTML代码器（一）</title><script>window.onload =function(){var btrun = document.getElementById("btrun");var cdarea = document.getElementById("cdarea");btrun.onclick =function(){if(cdarea.value !="将HTML代码粘在此处，点击运行即可。"){var newwin = window.open(‘‘, "_blank", ‘‘);newwin.document.open(‘text/html‘, ‘r...

一些有意思的HTML代码【代码】

1.垂直居中<!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><title>index</title><style>html,body {height: 100%;height:100%;margin: 0;padding: 0;}/*最通俗的做法.content {width: 300px;height: 300px;background: blue;margin: 0 auto; position: relative; top: 50%; margin-top: -150px; div上移自身高度(300)的一半}*//*利用CSS3的transform.content {width: 300px;height: 300px;background: blue;margin: ...

抓取天涯文章的蜘蛛代码，刚经过更新（因为天涯页面HTML代码变化）【代码】

#_*_coding:utf-8-*-import urllib2 import traceback import codecs from BeautifulSoup import BeautifulSoupdef openSoup(url,code):page = urllib2.urlopen(url)soup = BeautifulSoup(page,fromEncoding=code)#,fromEncoding="gb2312"#soup = BeautifulSoup(page,code)return soupdef getContentFromDiv(contents):s = ""for content in contents:try:s += contentexcept:passs = s.lstrip().rstrip()if len(s) < 50:return""e...

html代码对齐【图】

情景：所有html代码都在一行里面，我希望它们能按标准的格式换行对齐原始代码如下图：步骤一：把文件名后缀改为 xml，文件名现在是1.xml步骤二：用浏览器打开1.xml　　有报错，如图：步骤三：修改报错，把img标签补全　　本来的img标签缺少斜杠，所以是不完整的，如下　　<img class="song_img" src="http://y.gtimg.cn/music/photo_new/T002R300x300M000001Xgi710Hgd1y.jpg?max_age=2592000" style="height:120px;">　　在最后加...

在网页动态添加html代码时,使用jQuery调用隐藏的事件.

$(function() {　　var val;　　$("#add").live("click",function() { //使用.live("事件名称",方法) 调用隐藏的事件　　val=$(this).prev().val();　　});});原文：http://www.cnblogs.com/tan520/p/4713795.html

jQuery从html代码中获取对应标签的写法

#################################常用的标签选择器#########################################1、示例代码<div id=‘t1‘></div>获取id为t1标签$(‘#t1‘)2、示例代码<div class=‘t2‘></div>获取div标签$(‘.t2‘)3、示例代码<p>dagagagragag</p><p>dagagagragag</p>获取所有的p标签$(‘p‘)4、示例代码<div id=‘tt‘> <div class=‘t3‘> <p></p> <span></span> </div></div>获取id为tt的标签和p标签以及span...

delphi 插入 HTML代码播放器

Delphi在Webbrowser中插入 HTML/java script代码使用方法将下面的代码赋值到1个记事本里保存，然后保存为xxx.htm就可以看到效果使用PasteHtml实现功能的事件Windows Media播放器 mp3 mp4Windows Real PlayerFlash PlayerMid背景音乐图片的方法( (WebBrowser1.Document as IHTMLDocument2).selection.createRange as IHtmlTxtRange).pasteHTML(Memo1.Text);注意划删除线的表示使用这个函数无效果播放Mid背景音乐 src为Midi文...

flutter 显示HTML代码【代码】

需求是后台返回的是富文本，所以需要吧富文本转成flutter 能识别的内容找了几个插件只有这个比较好用写下来dependencies: flutter_html: ^0.9.8 安装下剩下的就比较简单了import ‘package:flutter_html/flutter_html.dart‘; 引入Html(data: """<div><h1>Demo Page</h1><p>This is a fantastic nonexistent product that you should buy!</p><h2>Pricing</...

分析JavaScript代码应该放在HTML代码哪个位置比较好【代码】

本文总结了多种放置JS代码的方法,需要的朋友可以参考下在哪里放置 JavaScript 代码？通常情况下，JavaScript 代码是和 HTML 代码一起使用的，可以将 JavaScript 代码放置在 HTML 文档的任何地方。但放置的地方，会对 JavaScript 代码的正常执行会有一定影响，具体如下所述。放置于<head></head>之间将 JavaScript 代码放置于 HTML 文档的 <head></head> 标签之间是一个通常的做法。由于 HTML 文档是由浏览器从上到下依次载入的，将...

webView 显示一段 html 代码【代码】【图】

1、布局文件<?xml version="1.0" encoding="utf-8"?><RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android"xmlns:tools="http://schemas.android.com/tools"android:layout_width="match_parent"android:layout_height="match_parent"android:fitsSystemWindows="true"tools:context=".MainActivity"><WebViewandroid:id="@+id/webview"android:layout_width="match_parent"android:layout_height="match_p...

首页 / HTML / 提取HTML代码中文字的C#函数

提取HTML代码中文字的C#函数

内容导读

内容图文

内容总结

内容备注

内容手机端

【提取HTML代码中文字的C#函数】教程文章相关的互联网学习教程文章

省份、城市、区县三级联动Html代码

C# winform中读取HTML代码

Dreamweaver如何格式化html代码【转载】【图】

颜色表及html代码

div+css页面布局-html代码

在线运行HTML代码器（一）【代码】

一些有意思的HTML代码【代码】

抓取天涯文章的蜘蛛代码，刚经过更新（因为天涯页面HTML代码变化）【代码】

html代码对齐【图】

在网页动态添加html代码时,使用jQuery调用隐藏的事件.

jQuery从html代码中获取对应标签的写法

delphi 插入 HTML代码播放器

flutter 显示HTML代码【代码】

分析JavaScript代码应该放在HTML代码哪个位置比较好【代码】

webView 显示一段 html 代码【代码】【图】

HTML - 相关标签

提取 - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程