AREM adalah berdasarkan MACS (Analisis Berbasis Model untuk data CHIP-Seq).
Tinggi-throughput sequencing digabungkan dengan kromatin presipitasi immuno- (CHIP-Seq) secara luas digunakan dalam menggambarkan genome pola mengikat faktor transkripsi, kofaktor, pengubah kromatin, dan protein DNA mengikat lainnya. Sebuah langkah penting dalam analisis data CHIP-Seq adalah untuk memetakan singkat berbunyi dari tinggi-throughput sequencing ke genom referensi dan mengidentifikasi daerah puncak diperkaya dengan singkat berbunyi.
Meskipun beberapa metode telah diusulkan untuk analisis CHIP-Seq, kebanyakan metode isting mantan hanya mempertimbangkan membaca yang dapat secara unik ditempatkan dalam genom referensi, dan karena itu memiliki daya rendah untuk mendeteksi puncak lo- berdedikasi dalam urutan ulangi. Di sini kita memperkenalkan proach ap probabilistik untuk analisis data CHIP-Seq yang memanfaatkan semua berbunyi, memberikan pandangan yang benar-benar genome pola mengikat.
Reads dimodelkan menggunakan model campuran yang sesuai dengan K daerah diperkaya dan latar belakang genomik nol. Kami menggunakan kemungkinan maksimum untuk memperkirakan lokasi daerah diperkaya, dan melaksanakan harapan-maksimisasi (EM) Algoritma, disebut AREM, untuk memperbarui probabilitas keselarasan setiap membaca lokasi genom yang berbeda.
Untuk informasi tambahan, lihat kertas kami di RECOMB 2011 atau kunjungi website kami: http://cbcl.ics.uci.edu/AREM
AREM didasarkan pada populer puncak MACS pemanggil, seperti yang dijelaskan di bawah ini:
Dengan perbaikan teknik sequencing, kromatin immunoprecipitation diikuti oleh sekuensing throughput yang tinggi (CHIP-Seq) semakin populer untuk mempelajari interaksi protein-DNA genome. Untuk mengatasi kekurangan metode analisis CHIP-Seq kuat, kami menyajikan algoritma baru, bernama Analisis Model berbasis CHIP-Seq (MACS), untuk mengidentifikasi faktor transkrip situs mengikat.
MACS menangkap pengaruh kompleksitas genom untuk mengevaluasi signifikansi diperkaya daerah CHIP, dan MACS meningkatkan resolusi spasial mengikat situs melalui menggabungkan informasi dari kedua tag posisi sequencing dan orientasi. . MACS dapat dengan mudah digunakan untuk data CHIP-Seq sendiri, atau dengan sampel kontrol dengan peningkatan spesifisitas
Persyaratan :
- Python
Komentar tidak ditemukan