文档详情

序列数据格式.pptx

发布:2017-05-28约小于1千字共35页下载文档
文本预览下载声明
序列数据格式 朱嵊 生物化学与分子生物学系 What is Data format? Data format or File format 定义  a standard way that information is encoded for storage in a computer file 数据保存在文件或者记录中的编排格式 例子 PNG, doc/docx, html, fasta, fastq 序列文件格式 Common sequence files Files from Sequencing platform Files from alignment/mapping Other files Common sequence files FATSA Qual Genbank Fastq FASTA QUAL Genbank FASTQ Files from Sequencing platform ab1 sff qual csfasta illumina Fastq ab1 峰图文件 or 色谱文件 sff Sff to fastq Sffinfo (454) sff_extract.py sff2fastq csfasta Illumina Fastq Files from alignment/mapping blast输出格式(m=8 or 0) 多序列比对格式(aln ) mapping格式(SAM/BAM) BLAT(PSL) BLAST (m=0) BLAST (m=8) aln SAM/BAM PSL(BLAT) Other files GFF/GTF ACE BED GFF/GTF ACE 定义:储存序列拼接结果的文件 BED 定义:代表基因组属性和注释信息 Required field Optional field 谢 谢
显示全部
相似文档