第四章使用Buffer处理,编码,解码二进制数据.PDF
文本预览下载声明
第四章:使用Buffer 处理,编码,解码二进制
数据
本章内容:
为什么需要用缓冲
用字符串创建缓冲
把缓冲转换成字符串
处理缓冲数据
缓冲数据的切分和复制
JavaScript很擅长处理字符串,但是因为它最初的设计是用来处理HTML文档,因此它并
不太擅长处理二进制数据。JavaScript 没有byte类型,没有结构化的类型(structured types),
甚至没有字节数组,只有数字和字符串。(原文:JavaScript doesn’t have a byte type — it
just has numbers — or structured types, or even byte arrays: It just has strings. )
因为Node 基于JavaScript ,它自然可以处理类似HTTP 这样的文本协议,但是你也可以
用它来跟数据库交互,处理图片或文件上传等,可以想象,如果仅仅用字符串来做这些事得
有多困难。早些时候,Node 通过将byte 编码成文本字符来处理二进制数据,但这种方式后
来被证明并不可行,既浪费资源,又缓慢,又不灵活,而且难以维护。
Node 有一个二进制缓冲实现Buffer,这个伪类(pseudo-class)提供了一系列处理二进
制数据的API ,简化了那些需要处理二进制数据的任务。缓冲的长度由字节数据的长度决定,
而且你可以随机的设置和获取缓冲内的字节数据。
注意:Buffer类有一个特殊的地方,缓冲内的字节数据所占用的内存不是分配在JavaScrp
It VM 内存堆上的,也就是说这些对象不会被JavaScript 的垃圾回收算法处理,取而代之的
是一个不会被修改的永久内存地址,这也避免了因缓冲内容的内存复制所造成的CPU 浪费。
创建缓冲
你可以用一个UTF-8 字符串创建缓冲,像这样:
var buf = new Buffer(‘Hello World!’);
也可以用指定编码的字符串创建缓冲:
var buf = new Buffer(8b76fde713ce, base64);
可接受的字符编码和标识如下:
ascii——ASCI ,仅适用于ASCII 字符集。
utf8——UTF-8,这种可变宽编码适用于Unicode 字符集的任何字符,它已经成
了Web 世界的首选编码,也是Node 的默认编码类型。
base64——Base64,这种编码基于64 个可打印ASCII 字符来表示二进制数据,
Base64 通常用于在字符文档内嵌入可以被转化成字符串的二进制数据,在需
要时又可以完整无损的转换回原来的二进制格式。
译者:Jack Yao ,本系列其它文章请查看/2013/01/08/pro-node-article-list/
如果没有数据来初始化缓冲,可以用指定的容量大小来创建一个空缓冲:
var buf = new Buffer(1024); // 创建一个1024 字节的缓冲
获取和设置缓冲数据
创建或接收一个缓冲对象后,你可能要查看或者修改它的内容,可以通过[]操作符来访
问缓冲的某个字节:
var buf = new Buffer(my buffer content);
// 访问缓冲内第10个字节
console.log(buf[10]); // - 99
注意:当你 (使用缓冲容量大小来)创建一个已初始化的缓冲时,一定要注意,缓冲
的数据并没有被初始化成0,而是随机数据。
var buf = new Buffer(1024);
console.log(buf[100]); // - 5 (某个随机值)
你可以这样修改缓冲里任何位置的数据:
buf[99] = 125; // 把第100 个字节的值设置为125
注意:在某些情况下,一些缓冲操作并不会产生错误,比如:
缓冲内的字节最大值为 255,如果某个字节被赋予大于 256 的数字,将会用
25
显示全部