文档详情

csv格式文件.doc

发布:2018-05-15约6.11千字共7页下载文档
文本预览下载声明
CSV逗号分隔值文件   规则   0 开头是不留空,以行为单位。   1 可含或不含列名,含列名则居文件第一行。   2 一行数据不垮行,无空行。   3 以半角符号,作分隔符,列为空也要表达其存在。   4 列内容如存在半角逗号(即,)则用半角引号(即)将该字段值包含起来。   5 列内容如存在半角引号(即)则应替换成半角双引号()转义。   6 文件读写时引号,逗号操作规则互逆。 7 内码格式不限,可为ASCII、Unicode或者其他。   CSV文件多用于储存数据,EXCEL文件可以方便地另存为CSV文件。   CSV最常见于图片扫描文件包中,以下为这种用途文件的介绍。   COMMA SEPARATED VALUE的缩写,出现在档案总管中的档案类型是「逗号分隔」,依计算机原来的设定,如果直接点选该档案,计算机将以EXCEL的模式开启该档案。但建议您千万不要这么做,因为CSV档如果以EXCEL开启,由于计算机档案数据转换的原因,会将其CRC之数值改做科学记号方式储存,而造成档案中的 CRC值发生错误。这也是笔者初出茅庐时所得到的惨痛经验,但如果想一窥CSV档的真实面貌,笔者建议您使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。 开启后的CSV档包含了四或五个字段(部分),由左至右分别记载着:文件名称(XXXX.JPG)、档案大小(以BYTE为单位)、CRC32值(八个英文字母或数字组成)、档案路径(档案储存的子目录名称)和档案内容描述(一般来说都是明星的英文姓名甚或是专辑名称,也可能空白)。而其中第四栏「档案路径」因为每个人储存整理图档的方式不同,所以本栏通常不存在,而一般有含有「档案路径」这栏的CSV档,又称为ECSV档案。   所谓“CSV”,是Comma Separated Value(逗号分隔值)的英文缩写,通常都是纯文本文件。 下面是一个实际CSV文件中的部分内容,让大家对他有一个感性的认识。我们选的是Sjojo_Rescan 的CSV文件 (Sjojo是ASW-亚洲扫图风的成员之一)。   sj_mino1001.jpg,715282,4FB55FE8,   sj_mino1002.jpg,471289,93203C5C,   sj_mino1003.jpg,451929,C4E80467,   通常CSV文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数据用逗号来分隔(标准英文逗号)。一般说来集图用的.CSV文件的格式是这样的:   文件名,文件大小(以字节为单位),CRC校验值,注释(可省略)   sj_mino1001.jpg,715282,4FB55FE8,   | | | |   文件名 文件大小 CRC值 注释(已省略)   如果你的机器上装了Microsoft Excel的话,.csv文件默认是被Excel打开的。需要注意的是,当你双击一个.CSV文件,Excel打开它以后即使不做任何的修改,在关闭的时候Excel往往会提示是否要 改成正确的文件格式,这个时候千万记得要选择“否”。因为Excel认为.CSV 文件中的数字是要用 科学记数法来表示的,而我们要的.CSV文件中的数字是普通的。如果你选择了“是”的话,Excel会把CSV文件中所有的数字用科学计数来表示(2.54932E+5这种形式),这个文件就没法用了。 所以如果你的CSV文件绝大部分都是用在集图上的话,建议把.CSV的默认打开方式改成任意一个文本编辑器,系统自带的记事本就是个不错的选择。   好,让我们回到CSV文件的格式中来。见上面,从左到右 sj_mino1001.jpg是文件名,715282 是以字节表示的文件大小。当文件名中包含逗号的时候,由于逗号在CSV文件中特殊的作用,为了不至于产生歧义,需要用引号把文件名括起来。比如 The Art, Fantasy.jpg,384211,...,.... 接着是一个8位的16进制数字 4FB55FE8,这是文件的CRC32校验值。整个CSV文件的精髓都在这里。   让我们举个小例子来说明它的意义:Sjojo发布了一张图sj_mino1001.jpg,假设你是从朋友手中拿 到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动过呢?是否无意中遭到了损坏呢?CRC就是为解决这个问题而存在的。一般情况下,扫图家每发布了一套图,就同时放出一个CSV文件(这种CSV通常叫做Official CSV,也就是官方发布的CSV的意思),这个CSV中的CRC值是用专门的软件通过CRC32算法(常用的CRC算法还有CRC16)对文件运算后生成的一个值,这个值可用作文件真身的标志。在绝大
显示全部
相似文档