首页 / NODEJS / 使用Node.js处理前端代码文件的编码问题_node.js

使用Node.js处理前端代码文件的编码问题_node.js

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用Node.js处理前端代码文件的编码问题_node.js，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2839字，纯文字阅读大概需要5分钟。

内容图文

使用 NodeJS 编写前端工具时，操作得最多的是文本文件，因此也就涉及到了文件编码的处理问题。我们常用的文本编码有 UTF8 和 GBK 两种，并且 UTF8 文件还可能带有 BOM。在读取不同编码的文本文件时，需要将文件内容转换为 JS 使用的 UTF8 编码字符串后才能正常处理。

BOM 的移除
BOM 用于标记一个文本文件使用 Unicode 编码，其本身是一个 Unicode 字符（"\uFEFF"），位于文本文件头部。在不同的 Unicode 编码下，BOM 字符对应的二进制字节如下：

  Bytes   Encoding
----------------------------
  FE FF    UTF16BE
  FF FE    UTF16LE
  EF BB BF  UTF8

因此，我们可以根据文本文件头几个字节等于啥来判断文件是否包含 BOM，以及使用哪种 Unicode 编码。但是，BOM 字符虽然起到了标记文件编码的作用，其本身却不属于文件内容的一部分，如果读取文本文件时不去掉 BOM，在某些使用场景下就会有问题。例如我们把几个 JS 文件合并成一个文件后，如果文件中间含有 BOM 字符，就会导致浏览器 JS 语法错误。因此，使用 NodeJS 读取文本文件时，一般需要去掉 BOM。例如，以下代码实现了识别和去除 UTF8 BOM 的功能。

GBK 转 UTF8
NodeJS 支持在读取文本文件时，或者在 Buffer 转换为字符串时指定文本编码，但遗憾的是，GBK 编码不在NodeJS自身支持范围内。因此，一般我们借助 iconv-lite 这个三方包来转换编码。使用 NPM 下载该包后，我们可以按下边方式编写一个读取 GBK 文本文件的函数。

单字节编码
有时候，我们无法预知需要读取的文件采用哪种编码，因此也就无法指定正确的编码。比如我们要处理的某些 CSS 文件中，有的用 GBK 编码，有的用 UTF8 编码。虽然可以一定程度可以根据文件的字节内容猜测出文本编码，但这里要介绍的是有些局限，但是要简单得多的一种技术。

首先我们知道，如果一个文本文件只包含英文字符，比如 Hello World，那无论用 GBK 编码或是 UTF8 编码读取这个文件都是没问题的。这是因为在这些编码下，ASCII0~128 范围内字符都使用相同的单字节编码。

反过来讲，即使一个文本文件中有中文等字符，如果我们需要处理的字符仅在 ASCII0~128 范围内，比如除了注释和字符串以外的JS代码，我们就可以统一使用单字节编码来读取文件，不用关心文件的实际编码是 GBK 还是 UTF8。以下示例说明了这种方法。

1. GBK编码源文件内容：

2. 对应字节：

  76 61 72 20 66 6F 6F 20 3D 20 27 D6 D0 CE C4 27 3B

3. 使用单字节编码读取后得到的内容：

4. 替换内容：

5. 使用单字节编码保存后对应字节：

  76 61 72 20 62 61 72 20 3D 20 27 D6 D0 CE C4 27 3B

6. 使用 GBK 编码读取后得到内容：

这里的诀窍在于，不管大于 0xEF 的单个字节在单字节编码下被解析成什么乱码字符，使用同样的单字节编码保存这些乱码字符时，背后对应的字节保持不变。

NodeJS 中自带了一种 binary 编码可以用来实现这个方法，因此在下例中，我们使用这种编码来演示上例对应的代码该怎么写。

内容总结

以上是互联网集市为您收集整理的使用Node.js处理前端代码文件的编码问题_node.js全部内容，希望文章能够帮你解决使用Node.js处理前端代码文件的编码问题_node.js所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/311311.html

来源：【匿名】

【上一篇】nodejs修复ipa处理过的png图片_node.js 【下一篇】node.js和php的区别有哪些？

更多 ►

【使用Node.js处理前端代码文件的编码问题_node.js】教程文章相关的互联网学习教程文章

Node.js设计模式使用流进行编码【图】

本文主要和大家分享Node.js设计模式使用流进行编码，希望能帮助到大家。Streams是Node.js最重要的组件和模式之一。社区中有一句格言“Stream all the things（Steam就是所有的）”，仅此一点就足以描述流在Node.js中的地位。 Dominic Tarr作为Node.js社区的最大贡献者，它将流定义为Node.js最好，也是最难以理解的概念。使Node.js的Streams如此吸引人还有其它原因; 此外，Streams不仅与性能或效率等技术特性有关，更重要的是它们的...

Node.js中使用Buffer编码、解码二进制数据详解

JavaScript很擅长处理字符串，但是因为它最初的设计是用来处理HTML文档，因此它并不太擅长处理二进制数据。JavaScript没有byte类型，没有结构化的类型（structured types），甚至没有字节数组，只有数字和字符串。（原文：JavaScript doesnt have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.）因为Node基于JavaScript，它自然可以处理类似...

Nodejs如何处理IE诡异的非英文URL编码【图】

众所周知URL里是不能出现除了英文数字和某些特殊符号外的其他字符的，也不能出现汉字。URL会出现汉字也就4种情况：网址路径(path)中包含汉字：如 https://zh.wikipedia.org/wiki/浏览器Get方法生成包含汉字的URL：一般是由表单生成的，比如 https://zh.wikipedia.org/w/index.php?search=%E6%B5%8F%E8%A7%88%E5%99%A8查询字符串(Query String)包含汉字：比如 https://zh.wikipedia.org/w/index.php?search=浏览器与第二种不同的是...

Node.js中使用Buffer编码和解码二进制数据的方法

这篇文章主要介绍了Node.js中使用Buffer编码、解码二进制数据详解,Buffer支持ascii、utf8、ucs2、base64等编码格式,需要的朋友可以参考下JavaScript很擅长处理字符串，但是因为它最初的设计是用来处理HTML文档，因此它并不太擅长处理二进制数据。JavaScript没有byte类型，没有结构化的类型（structured types），甚至没有字节数组，只有数字和字符串。（原文：JavaScript doesnt have a byte type — it just has numbers — or st...

Node.js文件编码格式转换方式汇总【图】

这次给大家带来Node.js文件编码格式转换方式汇总，Node.js文件编码格式转换的注意事项有哪些，下面就是实战案例，一起来看一下。项目很多 lua 文件不是 utf-8格式，使用 EditPlus 查看的时候，显示为ASCII。还有的是带BOM的，带BOM倒好处理，之前写过，有一定规律。ASCII编码就比较蛋疼，通过搜索网上资源，反复测试对比，最终形成下面比较靠谱的方法（有一些 EditPlus显示编码为utf-8但node.js库返回的却是其它编码>_<）判断修改是...

Node.js文件编码格式转换步骤详解【图】

这次给大家带来Node.js文件编码格式转换步骤详解，Node.js文件编码格式转换的注意事项有哪些，下面就是实战案例，一起来看一下。项目很多 lua 文件不是 utf-8格式，使用 EditPlus 查看的时候，显示为ASCII。还有的是带BOM的，带BOM倒好处理，之前写过，有一定规律。ASCII编码就比较蛋疼，通过搜索网上资源，反复测试对比，最终形成下面比较靠谱的方法（有一些 EditPlus显示编码为utf-8但node.js库返回的却是其它编码>_<）判断修改是...

node.js学习之base64编码解码【图】

一. Base64编码由来为什么会有Base64编码呢？因为有些网络传送渠道并不支持所有的字节，例如传统的邮件只支持可见字符的传送，像ASCII码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制，比如图片二进制流的每个字节不可能全部是可见字符，所以就传送不了。最好的方法就是在不改变传统协议的情况下，做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示，问题就解决了。Base64编码应运而生...

关于nodejsiconv的编码无效说明

关于编码转换或许你从网络途径得知是这样使用的var fs = require("fs"); var iconv=require("iconv-lite"); var request=require("request"); var txt=fs.readFileSync("./a.txt","utf8"); iconv.decode(txt,"gbk")request("http://jd.com",function(err,res,body){console.log(iconv.decode(body,"gbk")) });上面输出的结果还是乱码，并不能解码gbk 先最新的iconv不支持string解码了查看最新官方文档下面是正确的解码方式var fs ...

使用Node.js处理前端代码文件的编码问题_node.js

使用 NodeJS 编写前端工具时，操作得最多的是文本文件，因此也就涉及到了文件编码的处理问题。我们常用的文本编码有 UTF8 和 GBK 两种，并且 UTF8 文件还可能带有 BOM。在读取不同编码的文本文件时，需要将文件内容转换为 JS 使用的 UTF8 编码字符串后才能正常处理。 BOM 的移除 BOM 用于标记一个文本文件使用 Unicode 编码，其本身是一个 Unicode 字符（"\uFEFF"），位于文本文件头部。在不同的 Unicode 编码下，BOM 字符对应的二...

Node.js编码规范_node.js

调用函数的时候，函数名与左括号之间没有空格。函数名与参数序列之间，没有空格；所有其他语法元素与左括号之间，都有一个空格。使用小驼峰式命名法作为所有变量和属性的命名规则。缩进使用两空格，统一使用单引号。关联数组，除非键名中有空格或是非法字符，否则一律不用引号。不要将不同目的的语句，合并成一行。不要省略句末的分号，哪怕一行只有一个语句。不要使用自增（++）和自减（--）运算符，用+=和-=代替。不要使...

Node.js中使用Buffer编码、解码二进制数据详解_node.js?1.1.2

Nodejs中读取中文文件编码问题、发送邮件和定时任务实例_node.js【图】

关于nodejs读取中文文件真是折腾了不少时间，网上各种方案，最后没有一个适用我，好在解决了。下面的三个知识点都是从项目中抽出的，要单独运行脚本的话需要用全局模式来安装模块，比如安装中文转换模块（后续其它的也需要这么做）：代码如下: npm install -g iconv-lite npm install -g nodemailer npm install -g node-schedule1、nodejs读取中文文件编码问题准备一个文本文件（当然也可以是csv文件等）test.txt和text.csv，node...

nodejs批量修改文件编码格式_node.js

摘要：最近在制作手册的时候遇到了一个问题'文档乱码'，查看文件之后发现文件编码不对，总共100多个文件，如果用编辑器另存为utf8，那就悲催了。所以自己就写了个程序，批量修改文件编码格式。代码：代码如下: /*** 修改文件编码格式，例如：GBK转UTF8* 支持多级目录* @param {String} [root_path] [需要进行转码的文件路径]* @param {Array} [file_type] [需要进行转码的文件格式，比如html文件]* @param {String} [from_code] ...

nodejs爬虫抓取数据之编码问题_node.js【图】

cheerio DOM化并解析的时候 1.假如使用了 .text()方法，则一般不会有html实体编码的问题出现 2.如果使用了 .html()方法，则很多情况下(多数是非英文的时候）都会出现，这时，可能就需要转义一番了类似这些因为需要作数据存储，所有需要转换代码如下: Халк крушит. Новый способ исполнен大多数都是&#(x)?\w+的格式所以就用正则转换一番var body = ....//这里就是请求后获得的返回数据，或者那些 ....

Node.js文件编码格式的转换的方法【图】

项目很多 lua 文件不是 utf-8格式，使用 EditPlus 查看的时候，显示为ASCII。还有的是带BOM的，带BOM倒好处理，之前写过，有一定规律。 ASCII编码就比较蛋疼，通过搜索网上资源，反复测试对比，最终形成下面比较靠谱的方法（有一些 EditPlus显示编码为utf-8但node.js库返回的却是其它编码>_<）判断修改是否无误，只需要在修改完之后，通过SVN提交，浏览提交列表，双击任意一项待提交文件，如果显示下图所示的对话框，则说明修改成...

NODEJS - 技术教程分类

Node.js 教程 Node.js 安装配置 Node.js 创建第一个应用 NPM 使用介绍 Node.js REPL Node.js 回调函数 Node.js 事件循环 Node.js EventEmitter Node.js Buffer Node.js Stream Node.js 模块系统 Node.js 函数 Node.js 路由 Node.js 全局对象 Node.js 常用工具 Node.js 文件系统 Node.js GET/POST请求 Node.js 工具模块 Node.js Web 模块 Node.js Express 框架 Node.js RESTful API Node.js 多进程 Node.js MySQL Node.js MongoDB nodejs 全部

NODEJS - 最热教程

Node.js Error: Cannot find module ex...如何使用node.js实现获取微信用户授权（...node.js中的npmupdate如何使用 nodejsnpm包管理的配置方法及常用命令介...node.js+Ajax实现获取HTTP服务器返回数...nodejs调用cmd命令实现复制目录_node.j...快速搭建Node.js(Express)用户注册、登...nodejs入门教程五：连接数据库的方法分...nodejs中自动启用服务==类似于前端的热...14款NodeJS Web框架推荐

首页 / NODEJS / 使用Node.js处理前端代码文件的编码问题_node.js

使用Node.js处理前端代码文件的编码问题_node.js

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用Node.js处理前端代码文件的编码问题_node.js】教程文章相关的互联网学习教程文章

Node.js设计模式使用流进行编码【图】

Node.js中使用Buffer编码、解码二进制数据详解

Nodejs如何处理IE诡异的非英文URL编码【图】

Node.js中使用Buffer编码和解码二进制数据的方法

Node.js文件编码格式转换方式汇总【图】

Node.js文件编码格式转换步骤详解【图】

node.js学习之base64编码解码【图】

关于nodejsiconv的编码无效说明

使用Node.js处理前端代码文件的编码问题_node.js

Node.js编码规范_node.js

Node.js中使用Buffer编码、解码二进制数据详解_node.js?1.1.2

Nodejs中读取中文文件编码问题、发送邮件和定时任务实例_node.js【图】

nodejs批量修改文件编码格式_node.js

nodejs爬虫抓取数据之编码问题_node.js【图】

Node.js文件编码格式的转换的方法【图】

文件 - 相关标签

NODEJS - 技术教程分类

NODEJS - 最新教程

NODEJS - 最热教程