FASTA ve FASTQ arasındaki temel fark, FASTA'nın yalnızca nükleotid veya protein dizilerini depolayan metin tabanlı bir format olması, FASTQ'nun ise hem dizi hem de ilişkili dizi kalite değerlerini depolayan metin tabanlı bir format olmasıdır.
Biyoinformatik, özellikle veri kümesi karmaşık ve büyük olduğunda biyolojik verileri analiz etmek ve anlamak için farklı yazılımlar kullanan bir alandır. Bu alan biyolojik verileri analiz etmek ve yorumlamak için biyoloji, kimya, fizik, bilgisayar bilimi, bilgi mühendisliği, matematik ve istatistikleri birleştirir. FASTA ve FASTQ, dizileri hizalamak ve analiz etmek için biyoinformatik alanında iki dizi temsil formatıdır. Aslında, FASTQ, dizi kalitesini saklama yeteneği ile FASTA biçimini genişleten bir dizi dosya biçimidir.
FASTA nedir?
FASTA, DNA ve protein dizisi için bir hizalama yazılımıdır. FASTA yazılımı, FASTA formatını kullanır. Nükleotid dizilerini veya amino asit (protein) dizilerini temsil eden metin tabanlı bir formattır. Burada, tek harfli kodlar bu iki diziyi de temsil etmektedir. FASTA, biyoinformatik ve biyokimya alanlarında önemli bir araçtır. Bu biçim, dizi adlarının ve yorumların dizilerden önce gelmesine izin verir.
Şekil 01: FASTA Sırası
Bu format FASTA yazılımından kaynaklanmıştır ve 1985 yılında David J. Lipmann ve William R. Pearson tarafından tanıtılmıştır. FASTA aracı zaman içinde birçok değişikliğe uğramıştır ve en son sürüm protein:protein, DNA için programlardan oluşmaktadır.:DNA, protein:çevrilmiş DNA (çerçeve kaymalarıyla) ve sıralı veya sırasız peptit aramaları. FASTA belirli bir nükleotid veya amino asit dizisini okur ve benzer veri tabanı dizilerinin eşleşmelerini bulmak için yerel dizi hizalamasını kullanarak karşılık gelen dizi veritabanını arar.
FASTQ nedir?
FASTQ, hem biyolojik bir diziyi (genellikle nükleotid dizisini) hem de buna karşılık gelen kalite puanlarını depolayan, biyoinformatik alanında kullanılan bir hizalama yazılımıdır. FASTQ orijinal olarak FASTA formatlı bir diziyi ve ilgili kalite verilerini Wellcome Trust Sanger Institute tarafından bir araya getirmek için geliştirilmiştir. Biyoinformatik alanındaki gelişmelerle birlikte FASTQ, birçok yüksek verimli sıralama aracının çıktısını depolamak için fiili standart haline geldi.
FASTQ formatı, dizi başına dört farklı satır kullanır. 1. satır @ karakteri ile başlar ve bir dizi tanımlayıcısı (FASTA başlık satırına benzer) ile devam eder. Satır 2, ham sıra harflerinden oluşur. 3. satırda, dizi bir '+' karakteriyle başlar ve isteğe bağlı olarak aynı dizi tanımlayıcısı tarafından takip edilir.4. satır, 2. satırdaki dizinin kalite değerlerini kodlar ve dizideki harflerle aynı sayıda sembolden oluşmalıdır.
FASTA ve FASTQ Arasındaki Benzerlikler Nelerdir?
- FASTA ve FASTQ hizalama araçlarıdır.
- İki dizi gösterim biçimidir.
- Her ikisi de biyoinformatik alanıyla ilgilidir.
- Hem FAST hem de FASTQ, depolama ve sıralama amaçları için önemli araçlardır.
- FASTQ, dizi kalitesini saklama özelliğine sahip FASTA formatının bir uzantısıdır.
FASTA ve FASTQ Arasındaki Fark Nedir?
FASTA, yalnızca nükleotid veya protein dizilerini saklayan metin tabanlı bir formatken FASTQ, hem dizilimi hem de ilişkili dizi kalite değerlerini depolayan metin tabanlı bir formattır. Dolayısıyla, bu FASTA ve FASTQ arasındaki temel farktır. Ayrıca, FASTA, haritalandıktan sonra dizi parçalarını depolarken, FASTQ, haritalamadan önce dizi parçalarını depolar. Ayrıca, FASTA ve FASTQ arasındaki diğer bir fark, FASTA'nın bir açıklama satırından ve FASTAQ'ın dört satırdan oluşmasıdır.
Aşağıdaki infografik, FASTA ve FASTQ arasındaki farkları yan yana karşılaştırma için tablo biçiminde sunar.
Özet – FASTA vs FASTQ
Bioinformatics, FASTA ve FASTQ vb. gibi farklı dizi formatlarını kullanır. FASTA, haritalandıktan sonra dizi parçalarını depolarken, FASTQ dizi parçalarını haritalamadan önce saklar. FASTA, DNA ve protein dizisi için bir hizalama yazılımıdır. Protein:protein, DNA:DNA, protein:çevrilmiş DNA (çerçeve kaymalarıyla) ve sıralı veya sırasız peptit aramaları için programlardan oluşur. FASTQ, biyoinformatik alanında kullanılan bir hizalama yazılımıdır ve hem biyolojik bir diziyi (genellikle nükleotid dizisini) hem de buna karşılık gelen kalite puanlarını saklar. FASTA bir açıklama satırından oluşur ve FASTQ dört satırdan oluşur. Bu, FASTA ve FASTQ arasındaki farkı özetler.