這邊會以NGS常出現的檔案來介紹: fasta, FASTQ, sam, bam, bai, bed, bim, fam, vcf, bcf, gff/gtf, GWAS summary statistics.
fasta
最常見的就是 - fasta file或是 fasta 是最常見的NGS sequencer 輸出檔案。
fasta 檔案中一定是以 ">"開頭,在 ">"後可以打上sample名稱或是基因名稱,換行之後,就是核苷酸或是蛋白質序列資訊,結尾有可能會是".fa", ".fas"或".fasta"。
>