reciprocal_smallest_distance

Software screenshot:
reciprocal_smallest_distance
Rincian Software:
Versi: 1.1.5
Tanggal Upload: 20 Feb 15
Lisensi: Gratis
Popularitas: 42

Rating: 3.5/5 (Total Votes: 2)

reciprocal_smallest_distance adalah algoritma orthology berpasangan yang menggunakan keselarasan urutan global dan kemungkinan maksimum jarak evolusi antara urutan untuk secara akurat mendeteksi orthologs antara genom.
Menginstall Dari Tarbal
Download dan untar versi terbaru dari github:
cd ~
-L keriting https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Instal reciprocal_smallest_distance, pastikan untuk menggunakan Python 2.7:
cd reciprocal_smallest_distance-VERSION
python setup.py install
Menggunakan RSD Cari Othologs
Berikut contoh perintah menunjukkan cara utama untuk menjalankan rsd_search. Setiap doa rsd_search membutuhkan penentuan lokasi file urutan FASTA-diformat untuk dua genom, yang disebut query dan genom subjek. Pesanan mereka adalah sewenang-wenang, tetapi jika Anda menggunakan opsi --ids, id harus berasal dari genom permintaan. Anda juga harus menentukan file untuk menulis hasil orthologs ditemukan oleh algoritma RSD. Format file output berisi satu ortolog per baris. Setiap baris berisi permintaan urutan id, urutan id subjek, dan jarak (dihitung dengan codeml) antara urutan. Anda dapat menentukan file yang berisi id menggunakan opsi --ids. Maka RSD hanya akan mencari orthologs bagi mereka ids. Menggunakan --divergence dan --evalue, Anda memiliki pilihan untuk menggunakan ambang batas yang berbeda dari default.
Dapatkan bantuan bagaimana menjalankan rsd_search, rsd_blast, atau rsd_format:
rsd_search h
rsd_blast h
rsd_format h
Cari orthologs antara semua urutan dalam permintaan dan tunduk genom, menggunakan perbedaan standar dan evalue ambang
contoh rsd_search q / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Cari orthologs menggunakan beberapa perbedaan dan evalue ambang non-default
contoh rsd_search q / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Hal ini tidak perlu untuk memformat file FASTA untuk BLAST atau menghitung BLAST hit karena rsd_search melakukannya untuk Anda.
Namun, jika Anda berencana untuk menjalankan beberapa kali rsd_search untuk genom yang sama, terutama untuk genom besar, Anda dapat menghemat waktu dengan menggunakan rsd_format untuk preformatting file FASTA dan rsd_blast untuk precomputing BLAST hits. Saat menjalankan rsd_blast, pastikan untuk menggunakan --evalue sama besar dengan ambang batas evalue terbesar Anda berniat untuk diberikan kepada rsd_search.
Berikut adalah cara untuk memformat sepasang file FASTA di tempat:
rsd_format -g contoh / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Dan di sini adalah bagaimana format file FASTA, menempatkan hasil dalam direktori lain (direktori saat ini dalam kasus ini)
rsd_format -g contoh / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Berikut adalah cara untuk menghitung maju dan mundur hit ledakan (menggunakan evalue default):
rsd_blast v q contoh / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hits-hits q_s.hits --reverse s_q.hits
Berikut adalah cara untuk menghitung maju dan mundur ledakan hit untuk rsd_search, menggunakan genom yang telah diformat untuk ledakan dan evalue non-default
rsd_blast v q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
--forward-hits-hits q_s.hits --reverse s_q.hits
--no format --evalue 0.1
Cari orthologs antara semua urutan dalam query dan genom subjek menggunakan genom yang telah diformat untuk ledakan
rsd_search -q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no format
Cari orthologs antara semua urutan dalam query dan genom subjek menggunakan hits yang telah dihitung. Perhatikan bahwa --no format disertakan, karena sejak hits ledakan telah dihitung genom tidak perlu diformat untuk ledakan.
rsd_search v --query-genom Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hits-hits q_s.hits --reverse s_q.hits --no format
Cari orthologs untuk urutan tertentu dalam genom permintaan. Untuk menemukan orthologs hanya beberapa urutan, menggunakan --no-ledakan cache dapat mempercepat perhitungan. YMMV.
contoh rsd_search q / genom / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = contoh / genom / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
contoh -o / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids contoh / Mycoplasma_genitalium.aa.ids.txt --no-ledakan-Cache
Format output
Orthologs dapat disimpan dalam beberapa format yang berbeda dengan menggunakan opsi --outfmt dari rsd_search. Format default, --outfmt -1, mengacu --outfmt 3. Terinspirasi oleh Uniprot file dat, satu set orthologs dimulai dengan garis parameter, kemudian memiliki 0 atau lebih baris ortolog, kemudian memiliki garis akhir. Para parametes adalah nama permintaan genom, nama genom subjek, perbedaan ambang batas, dan evalue ambang batas. Setiap ortolog adalah pada satu baris daftar permintaan urutan id, id urutan subjek, dan perkiraan jarak maksimum likelihood. Format ini dapat mewakili orthologs untuk beberapa set parameter dalam satu file serta set parameter tanpa orthologs. Oleh karena itu sangat cocok untuk digunakan dengan rsd_search ketika menentukan beberapa perbedaan dan evalue batas.
Berikut adalah contoh yang mengandung 2 kombinasi parameter, salah satu yang tidak memiliki orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Format asli dari RSD, --outfmt 1, disediakan untuk kompatibilitas. Setiap baris berisi ortolog, direpresentasikan sebagai urutan subjek id, urutan permintaan id, dan perkiraan jarak kemungkinan maksimum. Ini hanya dapat mewakili satu set orthologs dalam file.
Contoh:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Juga disediakan untuk kompatibilitas adalah format yang digunakan secara internal oleh Roundup (http://roundup.hms.harvard.edu/) yang seperti format RSD asli, kecuali kolom id urutan query sebelum id urutan subjek.
Contoh:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Persyaratan :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2.04

Software yang serupa

edittag
edittag

20 Feb 15

Genepidgin
Genepidgin

20 Feb 15

TRMiner
TRMiner

14 Apr 15

Komentar untuk reciprocal_smallest_distance

Komentar tidak ditemukan
Tambahkan komentar
Aktifkan gambar!