Maklumat

18: Genomik Peraturan - Biologi


18: Genomik Peraturan

Genomik di bidang sains peraturan

Sains genomik telah memainkan peranan utama dalam penjanaan pengetahuan baru dalam arena penyelidikan asas, dan saat ini timbul pertanyaan mengenai potensinya untuk menyokong proses pengawalseliaan. Walau bagaimanapun, penyatuan genomik dalam proses pembuatan keputusan peraturan memerlukan penilaian yang ketat dan akan mendapat manfaat dari permuafakatan antara rakan antarabangsa dan komuniti penyelidikan. Untuk itu, Gabungan Global untuk Penyelidikan Sains Peraturan (GCRSR) menjadi tuan rumah Sidang Kemuncak Global keempat mengenai Sains Peraturan (GSRS2014) untuk membincangkan peranan genomik dalam pembuatan keputusan peraturan, dengan penekanan khusus pada aplikasi dalam keselamatan makanan dan pengembangan produk perubatan. Cabaran dan masalah dibahas dalam konteks pengembangan konsensus internasional untuk kriteria objektif dalam analisis, penafsiran dan pelaporan data genomik dengan penekanan pada ketelusan, kebolehkesanan dan "kecergasan untuk tujuan" untuk aplikasi yang dimaksudkan. Diakui bahawa ada keperluan untuk jalur global dalam pembentukan kerangka bioinformatik peraturan untuk pengembangan proses yang transparan, dapat diandalkan, dapat diulang dan dapat diaudit dalam pengelolaan risiko keselamatan produk makanan dan perubatan. Juga diakui bahawa latihan adalah mekanisme penting dalam mencapai hasil yang konsisten di peringkat antarabangsa. GSRS2014 menyediakan tempat yang efektif bagi pengawal selia dan penyelidik untuk bertemu, membincangkan isu-isu umum, dan mengembangkan kolaborasi untuk mengatasi tantangan yang ditimbulkan oleh penerapan genomik ke sains pengawalseliaan, dengan tujuan akhir untuk menggabungkan inovasi teknikal baru dengan bijak dalam pengambilan keputusan peraturan.

Kata kunci: Genomik Penjujukan generasi seterusnya sains Peraturan.


Penemuan sistematik dan gangguan gen pengawalseliaan dalam sel T manusia memperlihatkan seni bina rangkaian imun

Rangkaian pengawalseliaan gen yang kompleks memastikan bahawa gen penting dinyatakan pada tahap yang tepat. Apabila ekspresi gen terganggu, ia boleh menyebabkan penyakit. Untuk memahami bagaimana gangguan ekspresi gen meresap melalui rangkaian, pertama-tama kita harus memetakan hubungan antara gen pengawalseliaan dan sasaran hilirnya. Walau bagaimanapun, kami kekurangan pengetahuan menyeluruh mengenai pengatur hulu bagi kebanyakan gen. Di sini kami mengembangkan pendekatan untuk penemuan sistematik pengawal hulu faktor kekebalan kritikal - IL2RA, IL-2, dan CTLA4 - dalam sel T manusia primer. Kemudian, kami memetakan rangkaian gen sasaran dan penambah penguat ini menggunakan gangguan CRISPR, RNA-Seq, dan ATAC-Seq. Pengawal selia ini membentuk rangkaian yang saling berkaitan dengan gelung maklum balas yang luas. Tambahan pula, rangkaian ini sangat diperkaya untuk varian dan gen penyakit yang berkaitan dengan imun. Hasil ini memberikan gambaran tentang bagaimana gen penyakit yang berkaitan dengan kekebalan tubuh diatur dalam sel T dan prinsip yang lebih luas mengenai struktur rangkaian pengatur gen manusia.

Pendekatan sistematik untuk mengenal pasti pengatur hulu gen kekebalan utama dalam sel manusia primer

Peta gangguan RNA-Seq dan ATAC-Seq yang komprehensif setelah KO pengawal selia individu ditemui

Analisis mendapati rangkaian penguat dan gen yang sangat saling berkaitan dalam sel T

Rangkaian ini sangat diperkaya untuk varian penyakit imun dan gen yang memberi penerangan mengenai hubungan trans-peraturan antara gen kekebalan utama dalam kesihatan dan penyakit


Genomik Peraturan

Penyelidikan dalam bidang regulasi gen berkembang pesat dalam persekitaran saintifik yang selalu berubah. Kemajuan dalam teknik microarray dan genomik perbandingan memungkinkan kajian yang lebih komprehensif mengenai genomik pengawalseliaan. Kajian mengenai lokasi pengikatan genom faktor transkripsi telah memungkinkan pemodelan rangkaian pengawalseliaan yang lebih komprehensif. Di samping itu, urutan genomik yang lengkap dan perbandingan banyak spesies yang berkaitan telah menunjukkan pemuliharaan urutan DNA bukan pengekodan, yang sering memberikan bukti untuk cis-laman pengikatan peraturan. Kaedah sistematik untuk menguraikan mekanisme peraturan juga penting untuk mengesahkan rangkaian pengawalseliaan ini. Kaedah ini adalah algoritma penemuan motif yang dapat membantu meramalkan cis-elemen pengawalseliaan. Program penemuan motif DNA ini menjadi lebih canggih dan mula memanfaatkan bukti dari genomik perbandingan. Topik-topik ini dan banyak lagi dibincangkan di Bengkel RECOMB Tahunan ke-3 mengenai Regomatory Genomics, yang menghimpunkan lebih daripada 90 peserta dan merangkumi sekitar 22 ceramah yang sangat baik dari penyelidik terkemuka di lapangan. Jilid prosiding ini mengandungi sepuluh naskah asli terpilih yang dibentangkan semasa bengkel.

  • TScan: Dua Langkah De Novo Kaedah Penemuan Motif (O Abul et al.)
  • Penghapusan Redundansi dalam Algoritma Penemuan Motif (H Leung & amp F Chin)
  • GAMOT: Algoritma Genetik yang Efisien untuk Mencari Motif Mencabar dalam Urutan DNA (N Karaoglu et al.)
  • Pengenalpastian Tempat Regulasi Jarak Melalui Pemodelan Submotif (E Wijaya & amp R Kanagasabai)
  • Memperhalusi Pencari Motif dengan E-Nilai Pengiraan (N Nagarajan et al.)
  • Pelbagai Urutan Pengindeksan Pelbagai untuk Pengenalan Ciri Kumpulan (W-Y Chou et al.)
  • Meningkatkan Ketepatan Pembinaan Laluan Transduksi Isyarat Menggunakan Jiran Tahap-2 (T K F Wong et al.)
  • Menyiasat Peranan Fleksibiliti DNA dalam Pengiktirafan dan Peraturan Promoter (J D Bashford)
  • Rangkaian Regulasi Gen yang Dipengaruhi oleh MorA, Pengatur Global yang Mengandungi Domain GGDEF dan EAL di Pseudomonas Aeruginosa (W-K Choy et al.)
  • dan kertas lain

Siri yang dikemas kini & # x26 ed pada 11/06/2008

Kandungan yang dikemas kini, pp, tarikh pub & # x26 di hse pada 10/07/2008

PERKARA DEPAN
PREDIKASI PENGIRAAN ELEMEN PERATURAN MENGIKUT ANALISIS JENIS PERBANDINGAN

Dengan banyak genom vertebrata yang kini diuraikan sepenuhnya, kaedah yang paling menjanjikan untuk meramalkan unsur urutan berfungsi berdasarkan perbandingan urutan dari pelbagai spesies. Kami memberi tumpuan kepada masalah yang timbul ketika menggunakan alat tersebut pada skala sel genom di vertebrata. Masalah-masalah ini merangkumi kesukaran untuk mencari urutan penyokong homolog yang boleh dipercayai, kesukaran dalam memilih alat dan parameter terbaik untuk diterapkan pada urutan ini, dan kesukaran dalam menilai kepentingan ramalan yang dihasilkan. Penyelesaian ditawarkan untuk setiap masalah ini, walaupun masih belum selesai.

KISAH DUA TOPIK - PENTING MOTIF DAN SENSITIVITI Biji Biji

Mengira nilai p motif adalah masalah yang sangat sukar. Banyak algorihma heuristik cuba menghampirinya. Ternyata masalah ini sangat serupa dengan reka bentuk benih jarak yang optimum dalam pencarian homologi. Menyambungkan kedua-dua topik tersebut, untuk pertama kalinya kami menunjukkan pengkomputeran nilai-p adalah NP-keras, dan memberikan algoritma yang pantas dengan pengaturcaraan dinamik. Keputusan ujian akan diberikan.

CABARAN KOMPUTASIONAL UNTUK PEMODELAN DAN SIMULASI POLA JALAN BIOLOGI

Sekiranya konsep persamaan pembezaan biasa / separa menjadi satu-satunya cara untuk memodelkan laluan biologi untuk simulasi, pemahaman kita tentang kehidupan sebagai sistem melalui pengiraan tidak akan meningkat secara drastik dan akan sangat berat sebelah. Sekiranya bahasa untuk memodelkan dan menggambarkan jalan biologi tidak akan kaya, kita akan kehilangan banyak pengetahuan dan maklumat berharga mengenai sistem biologi yang dihasilkan dan dilaporkan. Dengan meletakkan pemahaman ini sebagai dasar pengembangan kami, kami telah mengembangkan format XML Cell System Markup Language CSML (http://www.csml.org/) dan alat pemodelan dan simulasi Cell Illustrator (http: //www.gene- rangkaian.com/). Dalam ceramah ini, kami membentangkan versi terbaru CSML 3.0 dan Cell Illustrator 3.0 yang menyokong CSML 3.0…

KAEDAH PEMERIKSAAN GIBBS YANG DIPERBAIKI UNTUK PENEMUAN MOTIF MENGIKUT BERAT BERAT

Penemuan motif dalam urutan DNA tetap menjadi masalah mendasar dan mencabar dalam biologi molekul komputasi dan genomik pengawalseliaan, walaupun sebilangan besar kaedah komputasi telah dicadangkan dalam dekad yang lalu. Di antara kaedah ini, strategi pengambilan sampel Gibbs telah menunjukkan janji yang bagus dan digunakan secara rutin untuk mencari elemen motif peraturan di wilayah penyokong gen yang dinyatakan bersama. Dalam makalah ini, kami menyajikan peningkatan pada metode pengambilan sampel Gibbs ketika data ekspresi gen yang bersangkutan diberikan. Skema pemberat urutan dicadangkan dengan mempertimbangkan variasi ekspresi gen secara eksplisit dalam pengambilan sampel Gibbs. Maksudnya, setiap elemen motif putatif diberi berat yang sebanding dengan perubahan lipatan pada tahap ekspresi gen hilirnya dalam satu keadaan eksperimen, dan matriks skor khusus kedudukan (PSSM) dianggarkan dari elemen motif putatif berwajaran ini. PSSM yang dianggarkan seperti ini mungkin mewakili model motif yang lebih tepat kerana elemen motif dengan perubahan lipatan dramatik dalam ekspresi gen lebih cenderung mewakili motif sebenar. Kaedah pensampelan Gibbs berwajaran ini telah dilaksanakan dan berjaya diuji pada data urutan simulasi dan biologi. Hasil percubaan kami menunjukkan bahawa penggunaan pemberat urutan mempunyai kesan yang mendalam terhadap prestasi algoritma pensampelan motif Gibbs.

MENEMUKAN MOTIF DENGAN PENGETAHUAN DOMAIN FAKTOR TRANSKRIPI

Mencari lokasi yang mengikat dari faktor transkripsi dari satu set wilayah penggalak gen yang diatur bersama adalah masalah penting dalam biologi molekul. Sebilangan besar algoritma penemuan motif menganggap corak serupa yang terlalu banyak dilambangkan sebagai laman pengikat dan mencari matriks skor kedudukan (PSSM) dengan kemungkinan maksimum sebagai motif penyelesaian. Walau bagaimanapun, banyak motif dalam data biologi sebenar tidak dapat dijumpai oleh algoritma ini kerana mereka tidak mempertimbangkan ciri biologi laman pengikat. Kami memperkenalkan algoritma baru, DIMDom, yang memanfaatkan dua jenis maklumat: (a) ciri khas kelas laman web yang mengikat, di mana kelas ditentukan berdasarkan maklumat biologi mengenai domain faktor transkripsi dan (b) kebarangkalian posterior kelas ini. Kami membandingkan prestasi DIMDom dengan MEME pada semua faktor transkripsi Drosophiia dalam pangkalan data TRANSFAC dan mendapati bahawa DIMDom mengatasi MEME dengan lebih daripada dua kali ganda jumlah kejayaan dan menggandakan ketepatan dalam mencari laman web dan motif yang mengikat.

APLIKASI ILP DALAM BIOLOGI KOMPUTASIONAL

Dalam kuliah tersebut, saya akan mengemukakan pelbagai masalah dalam Biologi Komputasi yang berkaitan khususnya dengan kombinasi filogenetik dan analisis rangkaian yang dapat didekati dengan berjaya menggunakan Pengaturcaraan Linear Integer.

MENGENAI EVOLUSI RANGKAIAN PERATURAN TRANSKRIPI

Kami sedang mengembangkan kaedah yang menggunakan urutan, ekspresi dan data lain dari pelbagai spesies, untuk mengenal pasti interaksi faktor transkripsi-DNA dan untuk mengesan evolusi mereka. Saya akan membincangkan beberapa usaha kami ke arah ini:

• Kajian mengenai dinamika perubahan minit dalam urutan peraturan, menggunakan genom dari empat spesies ragi yang berkait rapat.

• Analisis kestabilan dan perubahan modul transkrip dalam 17 spesies ragi, menggunakan data ekspresi dan urutan.

• Model evolusi bersepadu genom kod peraturan.

Gambaran evolusi yang muncul dalam rangkaian peraturan transkripsi cukup menarik. Sekiranya masa mengizinkan, saya juga akan membincangkan alat perisian novel kami untuk mencari motif de novo skala besar.

FARMAKOLOGI SISTEM DALAM TERAPEUTIK KANSER: INTERFASI INFORMATIKA-INTERATIF ITERATIF

Sistem biologi, sebagai disiplin, berusaha untuk menjelaskan fenomena biologi melalui interaksi bersih dari semua komponen sel dan biokimia dalam sel atau organisma. Kami menyajikan karya yang menggunakan pendekatan sistem untuk membina kerangka untuk farmakologi ramalan. Kami digunakan sebagai sistem model, tindak balas transkrip p53 in vitro dan tumor manusia. Pertama, kami menganalisis profil transkrip Pada 251 barah payudara primer di mana gen p53 telah diurutkan dan mengenal pasti tandatangan ekspresi 32 gen secara klinikal yang membezakan tumor p53-mutan dan jenis liar dari pelbagai histologi yang mengatasi urutan p53. Oleh itu, cap jari transkrip adalah penunjuk hiliran fungsi p53 yang lebih pasti. Kedua, kami mengenal pasti peranan unik untuk sintesis glikogen kinase-3beta (GSK-3beta) dalam mengatur fungsi p53 dalam sel barah kolorektal manusia. Modulasi farmakologi GSK-3beta mengalami gangguan transaktivasi p53 yang bergantung kepada sasaran termasuk p21 dan Puma tetapi mendorong pengaktifan konformasi B53 yang bergantung pada p53 yang menyebabkan apoptosis. Oleh itu, penangkapan kitaran sel selepas tindak balas kerosakan yang dimediasi oleh p53 ditukar menjadi apoptosis berikutan pendedahan kepada pelbagai agen kemoterapi (Tan, et al. Cancer Res. 65 (19): 9012-20., 2005). Kejayaan sebatian ini akan bergantung pada penilaian yang boleh dipercayai mengenai status p53 pada tumor primer. Berdasarkan pemerhatian ini, kami berusaha untuk mengenal pasti mekanisme peraturan gen p53 yang tepat dengan mengembangkan pendekatan yang kuat yang menyatukan imunoprecipitasi kromatin (ChIP) dengan strategi urutan ditag (PET) berpasangan untuk penyetempatan global yang tidak berat sebelah dan tepat pada lokasi pengikatan p53. Dari pensampelan jenuh lebih dari setengah juta urutan PET, kami mencirikan 65.572 serpihan DNA p53 ChIP unik dan mewujudkan kelompok PET bertindih sebagai pembacaan untuk menentukan lokasi pengikatan p53 dengan kekhususan yang luar biasa. Berdasarkan maklumat ini, kami menyempurnakan motif pengikatan p53 konsensus, mengenal pasti sekurang-kurangnya 542 lokasi mengikat dengan keyakinan tinggi, menemui 98 gen sasaran p53 yang sebelumnya tidak dikenali yang terlibat dalam aspek baru fungsi p53 seperti lekatan sel dan pergerakan. Akhirnya, kami menunjukkan kaitan klinikal mereka dengan tumorigenesis p53 yang bergantung pada sampel kanser primer (Wei CL, et al. Cell. 124 (1): 207-19, 2006). Kerangka penemuan yang saling menyokong yang kami tetapkan di GIS telah menjadi kunci untuk memanfaatkan maksimum penemuan individu secara kolektif.

PROTEOMIK STRUKTUR DAN PENGHASILAN INHIBITOR

Kemajuan cepat proteomik struktur memerlukan pengembangan kaedah baru untuk meramalkan perubahan struktur, pergaulan, fungsi, serta memperbaiki kaedah untuk reka bentuk molekul berdasarkan struktur. Cabaran utama biologi struktur kimia dan kimia akan dikaji. Kami telah mengembangkan kaedah untuk meramalkan peta fungsional protein dengan struktur 3D yang diketahui, penyambungan sebatian yang tepat ke laman web yang mengikat dan pemeriksaan ligan maya pangkalan data kimia yang besar, dan ramalan struktur dengan pengoptimuman tenaga global, mis. mencirikan mutan dan SNP, pemodelan homologi, protein protein atau dok peptida, dan ramalan gelung tepat ...

KARAKTERISASI TANGGUNGJAWAB TRANSKRIPSI TERHADAP STRES ALAM SEKITAR DENGAN ANALISIS LOKASI BERBEZA

Organisma uniselular seperti ragi, perlu cepat bertindak balas terhadap perubahan keadaan persekitaran untuk kelangsungan hidup mereka. Dengan menggunakan analisis lokasi throughput tinggi (Chromatin Immuno-Precipitation on DNA chip, atau ChIP-Chip secara ringkas), Harbison et al. telah menentukan lokasi pengikatan genomik 204 faktor transkripsi (TF) dari ragi Saccharomyces cerevisiae dalam keadaan media kaya dan 13 keadaan tekanan. Di sini, kami melaporkan kaedah statistik untuk analisis lokasi pembezaan, untuk menentukan sekumpulan pengatur yang mengikat kawasan genomik yang berbeza dengan keadaan tekanan tertentu. Dari data ChIP-Chip yang diterbitkan oleh Harbison et al., Kami dapat mengenal pasti 105 pasangan keadaan-TF yang menunjukkan corak pengikat pembezaan yang signifikan secara statistik (p & lt 0.05). Perbandingan dengan data Microarray yang diterbitkan menunjukkan bahawa tahap ekspresi hampir separuh TF yang diuji tidak berubah secara signifikan di bawah tekanan persekitaran yang sesuai, yang menyiratkan bahawa tindak balas peraturan tersebut tidak akan didedahkan semata-mata oleh data Microarray. Sebagai kesimpulan, analisis pembezaan pelengkap (mis. Analisis lokasi pembezaan) diperlukan, selain analisis ekspresi pembezaan berasaskan mikroarray yang biasa digunakan, untuk memahami gambaran global mengenai tindak balas selular terhadap tekanan persekitaran.

ALGORITMA HYBRID BERASASKAN PENGETAHUAN UNTUK PREDIKSI STRUKTUR SEKOLAH MENENGAH

Dalam pendekatan sebelumnya, kami mencadangkan kaedah hibrid yang disebut HYPROSP II untuk ramalan struktur sekunder protein, yang menggabungkan algoritma ramalan berasaskan pengetahuan yang dicadangkan kami PROSP dan pendekatan jaringan saraf PSIPRED. Dalam ceramah ini, kami terus meningkatkan prestasi PROSP dengan mencadangkan strategi pengundian yang lebih baik dan kadar liputan yang lebih luas menggunakan kedua-dua 7-mers dan 5-mers…

MONOTONI DAN KEJOHANAN (PENDEKATAN KONSERVATIF TERHADAP PENEMUAN POLA)

Penemuan corak sering terkoyak antara ketegaran model dan banyaknya calon, keadaan yang cenderung menimbulkan beban komputasi yang menakutkan, dan menimbulkan throughput yang mustahil untuk dilihat dan dicerna…

EVOLUSI SISTEM PERATURAN BAKTERI

Analisis perbandingan genom bakteria memungkinkan bukan hanya untuk mengenal pasti sistem pengawalseliaan baru dan anotasi fungsional gen hipotesis, tetapi juga untuk pencirian perubahan dalam corak peraturan. Walaupun terlalu awal untuk berbicara mengenai teori evolusi peraturan, beberapa corak mula muncul. Saya akan membentangkan hasil analisis genomik dari beberapa sistem yang mempunyai kerumitan yang berbeza-beza. Secara khusus, saya akan menunjukkan bagaimana analisis komputasi NrdR, pengatur universal reduktase ribonukleotida, telah menghasilkan penerangan terperinci mengenai isyarat peraturan dan mekanisme peraturan, dan telah menjalin hubungan antara regulon dan replikasi ini. Saya akan mengemukakan contoh pengembangan, pengecutan, penggabungan dan penghilangan regulon dalam laluan metabolisme oligosakarida dan penggunaan gula. Akhirnya, saya akan berusaha untuk menyusun semula sejarah evolusi peraturan sistem homeostasis besi di alpha-proteobacteria.

TSCAN: DUA LANGKAH DE NOVO KAEDAH PENEMUAN MOTIF

Penemuan komputasi motif novel dalam urutan biologi adalah masalah penting dan dikaji dengan baik. Kunci kaedah penemuan motif, sama ada de novo atau berasaskan perpustakaan, mempunyai fungsi pemarkahan yang ditentukan dengan baik. Beberapa fungsi pemarkahan bernilai skalar yang berbeza telah diusulkan yang mengukur beberapa sifat motif biologi. Walau bagaimanapun, tidak ada fungsi pemarkahan umum yang dapat menyatukan semua sifat bersama. Dalam karya ini, kami mencadangkan dua langkah de novo paradigma penemuan motif menggunakan dua fungsi pemarkahan yang mengukur sifat-sifat relevan biologi yang berbeza. Kami menentukan kaedah berdasarkan penghitungan kata, disebut TScan, menggunakan paradigma ini. Ia terutamanya diilhamkan oleh MDScan, tetapi tidak memerlukan data cip-cip tambahan.Hasil kami pada tujuh kumpulan data dari sebuah kajian baru-baru ini sangat menjanjikan, dengan motif yang ditemui setuju dengan motif konsensus yang ditentukan untuk kumpulan data.

PENGHILANGAN PENGURANGAN DALAM ALGORITMA PENEMUAN MOTIF

Masalah mencari motif di laman pengikat sangat penting untuk memahami rangkaian peraturan gen. Walau bagaimanapun, ketika meramalkan satu set motif, algoritma yang ada mengalami masalah sama ada meramalkan banyak motif berlebihan (motif dengan laman pengikat yang serupa) atau, pada tahap lain, kehilangan motif tersembunyi. Dalam makalah ini, kami merumuskan Motif Redundancy Problem (MRP) untuk memodelkan masalah semacam ini dan memperkenalkan algoritma yang disebut RME (Redundancy Motif Elimination) untuk menyelesaikan MRP. Hasil eksperimen pada data biologi sebenar menunjukkan bahawa algoritma penemuan motif berasaskan EM yang disempurnakan dengan RME mempunyai prestasi yang lebih baik daripada algoritma penemuan motif popular MEME.

GAMOT: ALGORITMA GENETIK YANG BERKESAN UNTUK MENCARI MOTIF YANG MENCABAR DALAM JENIS DNA

Isyarat lemah yang menandakan laman pengikat faktor transkripsi yang terlibat dalam peraturan gen dianggap sebagai motif yang mencabar. Mengenal pasti motif ini dalam urutan DNA yang tidak selaras adalah masalah yang sukar dikira dan memerlukan algoritma yang cekap. Genetik Algoritma (GA), yang diilhamkan dari evolusi di alam semula jadi, adalah kelas algoritma carian stokastik yang berjaya diterapkan untuk banyak masalah yang sukar dikira, termasuk ramalan laman peraturan. Dalam makalah ini, kami mencadangkan GAMOT, GA yang efisien untuk menyelesaikan Masalah Tumbuhan (l, d) -Motif yang diperkenalkan oleh Pevzner dan Sze. Kami menunjukkan secara empirik bahawa algoritma kami bukan sahaja dapat menyelesaikan masalah yang mencabar dengan motif pendek seperti (14,4) dan (15,4) dengan cekap tetapi juga mampu menyelesaikan masalah dengan motif yang lebih panjang seperti (20, 7), (30,11) dan (40,15). GAMOT dapat menemui motif yang ditanam dalam masa pengiraan linear hampir dengan langkah tambahan yang menghasilkan penyelesaian yang sangat sesuai sebelum proses evolusi diterapkan. Kami menyajikan perbandingan hasil kami dengan beberapa algoritma canggih seperti VAS dan PROJEKSI.

PENGENALAN SITUS PERATURAN YANG DIPEROLEH DENGAN PEMODELAN SUBMOTIF

Dalam makalah ini kami mengusulkan pendekatan baru untuk mengenal pasti motif generik secara bersepadu dengan memperkenalkan gagasan submotif. Kami merumuskan masalah penemuan motif sebagai perlombongan pola submotif terkendali dan menyajikan algoritma yang disebut SPACE untuk mengenal pasti motif yang mungkin mengandungi spacer. Ketika spacer ada, kita menunjukkan bahawa algoritma dapat mengenal pasti motif di mana 1) spacer mungkin panjangnya berbeza-beza, 2) jumlah segmen motif mungkin tidak diketahui, dan 3) panjang segmen motif mungkin tidak diketahui. Kami melakukan eksperimen ketat dengan Penanda Aras Penilaian Motif oleh Tompa et al., Dan memerhatikan bahawa algoritma kami secara keseluruhan dapat mengungguli semua algoritma popular yang diuji setakat ini, dengan peningkatan yang signifikan terhadap kepekaan dan kekhususan.

MENYEMPURNAKAN PENEMUAN MOTIF DENGAN PENGIRAAN E-NILAI

Pencari motif adalah alat penting untuk mencari unsur pengawalseliaan dalam DNA. Program sedia ada yang popular mengoptimumkan skor entropi untuk mencari motif dengan cekap. Walaupun E -values ​​biasanya digunakan untuk memberikan makna motif yang optimum yang dilaporkan, mereka tidak dioptimumkan secara langsung. Ini menimbulkan persoalan adakah mengoptimumkan nilai E dan bukannya entropi dapat meningkatkan kemampuan pencari untuk mengesan motif yang lemah. Mula-mula kami membentangkan algoritma yang cekap untuk mengira pelbagai nilai E dengan tepat yang mengubah sifat soalan di atas dari hipotesis menjadi praktikal. Dengan memasukkan kaedah ini ke dalam pencari berdasarkan CONSENSUS dan Gibbs, kami kemudian menunjukkan pada data sintetik bahawa jawapan untuk soalan kami adalah positif. Khususnya, pengoptimuman berdasarkan nilai E menunjukkan peningkatan yang ketara berbanding alat yang ada untuk mencari motif lebar yang tidak diketahui.

PELAKSANAAN JAMINAN PELBAGAI INDEKS UNTUK IDENTIFIKASI CIRI KUMPULAN

Skema baru untuk corak kombinatori dan pengenalan ciri kumpulan eksklusif yang menggunakan penjajaran urutan pengindeksan berganda (MISA) berdasarkan algoritma pencarian lompatan selang dan teknik pengelompokan hierarki dicadangkan dalam makalah ini. Algoritma pencarian lompatan selang mengubah urutan menjadi set nombor digital untuk mencari motif konsensus dan memberikan hasil yang hampir sama. Motif konsensus yang dicari dengan ciri toleransi dilabel dan dirumuskan matriks skor untuk mengelompokkan urutan yang diimport ke dalam beberapa subkumpulan sebelum penjajaran urutan pengindeksan yang dicadangkan. Untuk mengekstrak ciri-ciri yang dapat dibezakan di antara kelompok-kelompok yang berkelompok, sistem yang dicadangkan melakukan pelbagai kombinasi operasi bitwise asas untuk mendapatkan ciri khasnya. Dalam makalah ini, MISA telah digunakan untuk menganalisis data biologi sebenar dan terbukti praktikal untuk mencari corak kombinasi untuk setiap subkumpulan dan ciri khasnya dari subkumpulan lain juga dikenal pasti untuk analisis lebih lanjut. Perbandingan dengan algoritma lain yang ada juga disajikan dalam makalah ini untuk menunjukkan prestasi unggul dari sistem yang dicadangkan.

MENINGKATKAN KETENTUAN PEMBINAAN PATHWAY TRANSDUCTION SIGNAL MENGGUNAKAN TINGKAT-2 TINGKAT

Dalam makalah ini, kami mempertimbangkan masalah penyusunan semula jalur untuk sekumpulan protein tertentu berdasarkan maklumat genomik dan proteomik yang tersedia seperti data ekspresi gen. Dalam semua pendekatan sebelumnya, fungsi pemarkahan untuk jalur calon biasanya hanya bergantung pada protein bersebelahan di jalur tersebut. Kami mencadangkan untuk mempertimbangkan protein yang jaraknya dua di jalur (kami memanggilnya jiran Tahap-2). Kami memperoleh fungsi pemarkahan berdasarkan protein bersebelahan dan tetangga Tahap-2 di jalur dan menunjukkan bahawa fungsi pemarkahan kami dapat meningkatkan ketepatan jalur yang diramalkan melalui satu set eksperimen. Masalah pengkomputeran jalan dengan skor optimum, secara umum, sukar dilakukan NP. Oleh itu, kami mengembangkan algoritma rawak untuk menjadikannya berfungsi pada fungsi pemarkahan kami untuk mengira jalan optimum dengan kebarangkalian yang tinggi.

MENYELESAIKAN PERANAN FLEKSIBILITI DNA DALAM PENGIKTIRAFAN DAN PERATURAN PROMOTER

Kami cuba mengkuantifikasi sebahagian dari "pembacaan tidak langsung" ciri pengiktirafan promoter yang dapat meningkatkan atau menghalang pengikatan RNA polimerase. Dengan menggunakan kemajuan terkini dalam memahami kelenturan B-DNA, kami mengembangkan dan menguji model mainan lenturan DNA. Model ini digunakan untuk menganggarkan kos energetik jenis tikungan tertentu, mensimulasikan peristiwa mengikat DNA-protein, di setiap laman dalam urutan DNA yang mengandungi promoter. Fleksibiliti penganjur yang kuat dan tidak terkawal dari lytic coliphages dibandingkan dengan yang lemah dan tidak terkawal Escherichia coli urutan. Kami dapati i) dalam kedua-dua kes, lokasi yang disukai untuk memperkenalkan selekoh berukuran RNAP sering berada di wilayah promoter inti walaupun, secara proporsional, urutan fage yang jauh lebih banyak mempunyai ciri ini ii) promoter yang diatur oleh Crp (faktor transkripsi lentur DNA) kekurangan ciri ini, menjadi 50 hingga 80 laman web yang paling fleksibel di hulu permulaan. Pemerhatian ini mungkin menunjukkan i) fleksibiliti teras dalam penganjur yang tidak diatur meningkatkan aktiviti transkripsi dan ii) peranan yang berbeza untuk fleksibiliti dalam urutan yang diatur oleh Crp berbanding dengan pengaktifan yang tidak diatur.

RANGKAIAN PERATURAN GENES YANG DIPENGARUHI OLEH MORA, PENGAWAL GLOBAL YANG MENGANDUNGI DOMAIN GGDEF DAN EAL DI PSEUDOMONAS AERUGINOSA

Pseudomonas aeruginosa adalah patogen bakteria oportunistik yang terkenal, yang menyebabkan kematian tinggi pada pesakit yang dikompromikan secara imun. Ini adalah penyebab utama peningkatan morbiditi dan kematian pada pesakit cystic fibrosis (CF) (Stover et al., 2000) dan pada pesakit dengan jangkitan yang berkaitan dengan AIDS (Quinn, 1998). Pesakit CF biasanya mengalami jangkitan saluran pernafasan oleh P. aeruginosa, yang boleh menyebabkan jangkitan paru-paru yang berterusan. Pesakit seperti itu akhirnya mengalami kerusakan paru-paru yang disebabkan oleh jangkitan berterusan, yang mengakibatkan kegagalan paru-paru dan kematian (Stover et al., 2000). Laporan mengenai P. aeruginosa jangkitan dari hospital semakin berleluasa. Tinjauan di United Kingdom menunjukkan bahawa organisma yang paling biasa diasingkan dari dahak pesakit CF adalah P. aeruginosa (Pitt et al., 2003). Dalam kajian Itali, P. aeruginosa pengasingan menyumbang 14% daripada 25.266 isolat bakteria aerobik berturut-turut dan 21% isolat bakteria Gram negatif penting dari pesakit (Bonfiglio et al., 1998). Dua sebab utama telah muncul untuk kegigihan P. aeruginosa pada jangkitan hospital dan pesakit CF yang membawa kepada keadaan kronik (i) penubuhan biofilm (komuniti bakteria yang dilekatkan pada permukaan) pada paru-paru pesakit CF dan (ii) kemunculan strain tahan pelbagai ubat (MDR) P. aeruginosa. Biofilem bakteria boleh menyebabkan masalah persekitaran yang serius dan sel menjadi 100 hingga 1000 kali ganda lebih tahan terhadap agen antimikroba. Atas sebab-sebab ini, terdapat banyak minat di seluruh dunia dalam pembangunan antibiotik antipseudomonal yang akan sangat berkesan dalam memerangi pembentukan biofilm. Pengatur novel, morA, sebelumnya dikenal pasti mempengaruhi pembentukan biofilm di P. aeruginosa (Choy et al., 2004). Kajian ekspresi gen kemudian dilakukan pada Jenis Liar (WT) dan morA mutan dari P. aeruginosa. Dari hasil kajian ekspresi, beberapa gen yang menunjukkan perbezaan yang signifikan antara WT dan mutan dipilih untuk analisis lebih lanjut. Ini membawa kepada pengembangan jaringan yang menghubungkan gen berdasarkan kesamaan di wilayah penganjur atau peraturan mereka. Gen yang sangat berhubung dengan rangkaian sangat menarik dan kajian lebih lanjut mengenai gen ini dapat membantu menjelaskan hubungan antara P. aeruginosa motilitas dan keperitannya.


Rujukan

Acuna-Hidalgo R, Veltman JA, Hoischen A. Wawasan baru mengenai penjanaan dan peranan mutasi de novo dalam kesihatan dan penyakit. Genom Biol. 201617: 241.

Collins RL, Jenama H, Redin CE, Hanscom C, Antolik C, Stone MR et al. Menentukan spektrum variasi struktur kompleks besar dan kromotripsis ekstrem di Morbid Human Germline. Genom Biol. 10.1186 / s13059-017-1158-6

Shaheen R, Szymanska K, Basu B, Patel N, Ewida N, Faqeih E, et al. Mencirikan genom ciliopathies yang morbid. Genom Biol. 201617: 242.

Eggers S, Sadedin S, van den Bergen JA, Robevska G, Ohnesorg T, Hewitt J, et al. Gangguan perkembangan seks: pandangan dari penjujukan gen yang disasarkan pada kumpulan pesakit antarabangsa yang besar. Genom Biol. 201617: 243.

Shamseldin HE, Masuho I, Alenizi A, Alyamani S, Patil DN, Ibrahim N, et al. Mutasi GNB5 menyebabkan gangguan neuropsikiatrik baru yang memaparkan gangguan hiperaktif kekurangan perhatian, perkembangan bahasa yang teruk dan kognisi normal. Genom Biol. 201617: 195.

Abouelhoda M, Faquih T, El-Kalioby M, Alkuraya FS. Meninjau semula genom morfid gangguan Mendelian. Genom Biol. 201617: 235.

Jansen IE, Ye H, Heetveld S, Lechler M, Michels H, Seinstra RI et al. Penemuan dan keutamaan fungsional gen calon penyakit Parkinson dari penjujukan keseluruhan exome berskala besar. Genom Biol. 10.1186 / s13059-017-1147-9

Katsanis N. Kesinambungan penyebab dalam gangguan genetik manusia. Genom Biol. 201617: 233.

Delahaye-Duriez A, Srivastava P, Shkura K, Langley SR, Laaniste L, Moreno-Moral A, et al. Epilepsi jarang dan biasa berkumpul di rangkaian pengatur gen bersama yang memberikan peluang untuk penemuan ubat antiepileptik baru. Genom Biol. 201617: 245.

Yu B, de Vries PS, Metcalf GA, Wang Z, Feofanova EV, Liu X, et al. Analisis urutan genom keseluruhan tahap asid amino serum. Genom Biol. 201617: 237.

Quintana-Murci L. Memahami penyakit jarang dan biasa dalam konteks evolusi manusia. Genom Biol. 201617: 225.

Sams AJ, Dumaine A, Nédélec Y, Yotova V, Alfieri C, Tanner JE, et al. Haplotip Neandertal yang diadaptasi secara adaptif di lokus OAS secara fungsinya memberi kesan tindak balas imun semula jadi pada manusia. Genom Biol. 201617: 246.

Hannon E, Dempster E, Viana J, Burrage J, Smith AR, Macdonald R, et al. Analisis genetik-epigenetik skizofrenia bersepadu: bukti untuk penyetempatan bersama persatuan genetik dan metilasi DNA berbeza. Genom Biol. 201617: 176.

Meddens CA, Harakalova M, van den Dungen NAM, Asl HF, Hijma HJ, Cuppen EPJG, et al. Analisis sistematik interaksi kromatin pada lokus penyakit menghubungkan gen calon baru dengan penyakit radang usus. Genom Biol. 201617: 247.

Ligthart S, Marzi C, Aslibekyan S, Mendelson MM, Conneely KN, Tanaka T, et al. Tanda tangan metilasi DNA keradangan peringkat rendah kronik dikaitkan dengan penyakit kompleks. Genom Biol. 201617: 255.

Joehanes R, Zhang X, Huan T, Yao C, Ying S-X, Nguyen QT et al. Analisis genom bersepadu mengenai sifat kuantitatif ungkapan kuantitatif membantu pentafsiran kajian persatuan genom. Genom Biol. 10.1186 / s13059-016-1142-6

McGovern A, Schoenfelder S, Martin P, Massey J, Duffus K, Plant D, et al. Tangkap Hi-C mengenal pasti gen kausal novel, IL20RA, di kawasan kerentanan gen pan-autoimun 6q23. Genom Biol. 201617: 212.

Nazeen S, Palmer NP, Berger B, Kohane IS. Analisis integrasi kumpulan data genetik menunjukkan komponen kekebalan bawaan yang dikongsi dalam gangguan spektrum autisme dan penyakit bersama. Genom Biol. 201617: 228.

Liang S, et al. iRegNet3D: Rangkaian pengawalseliaan bersepadu 3D untuk analisis genomik mutasi penyakit pengekodan dan bukan pengekodan. Genom Biol. 201718: 10.

Chen L, Jin P, Qin ZS. DIVAN: pengenalpastian tepat mengenai varian risiko spesifik penyakit bukan kod menggunakan profil multi-omics. Genom Biol. 201617: 252.

Sumbangan pengarang

Kedua-dua pengarang menulis dan meluluskan manuskrip terakhir.

Memikat minat

MIM berfungsi pada panel penasihat untuk Pfizer dan NovoNordisk telah menerima honor dari Pfizer, NovoNordisk, dan Eli Lilly dan telah menerima pembiayaan penyelidikan dari Pfizer, Eli Lilly, NovoNordisk, Sanofi-Aventis, Boehringer Ingelheim, Astra Zeneca, Janssen, Takeda, Roche, Merck , Abbvie, dan Servier sebagai sebahagian daripada inisiatif penyelidikan pra-persaingan yang disokong oleh Inisiatif Ubat Inovatif dan Perkongsian Ubat Mempercepat. DGM adalah pengasas dengan ekuiti di Goldfinch Biopharma, dan telah menerima pembiayaan penyelidikan dari Biogen, Merck, Pfizer, dan Eisai.


Perbincangan

Dalam karya ini, kami menunjukkan kegunaan sistem pemberitaan DNA-tag untuk pengukuran positif, kuantitatif yang tinggi cis-kegiatan pengawalseliaan: pertama, dengan mengenal pasti de novo 81 CRM aktif untuk 34 gen dan kedua, dengan pengukuran resolusi tinggi serentak output temporal & # x0003e80 CRM aktif. Tidak ada sebab yang jelas mengapa sistem tag DNA yang dirancang berdasarkan prinsip yang sama seperti yang ditunjukkan di sini tidak boleh berfungsi dalam sistem model lain. Pendekatan ini boleh dipindahkan secara langsung ke haiwan atau tumbuh-tumbuhan lain dengan hanya sedikit pengubahsuaian, seperti perubahan penggalak basal menjadi yang endogenous yang aktif.

Kekuatan dan Kelemahan High-Throughput cis-Analisis Regulasi Menggunakan Tag Vektor.

Kelebihan utama yang diberikan oleh pendahuluan ini adalah jelas: ia memberikan peningkatan besar dalam kecekapan dan kadar operasi yang paling penting dalam genomik fungsional eksperimen, cis-kajian analisis. Penggunaan sistem 13 DNA-tag secara harfiah memberikan peningkatan dalam kadar analisis 10 kali ganda, di samping memberikan peluang untuk pengukuran perbandingan beberapa CRM dalam eksperimen yang sama. Eksperimen menggunakan sistem 129 DNA-tag bahkan tidak dapat dibuat secara praktikal menggunakan kaedah tradisional, jadi walaupun dapat dikira bahawa kadar analisis ditingkatkan & # x0003e100 kali ganda, peningkatan sebenarnya adalah kualitatif: kita sekarang dapat mempertimbangkan jenis eksperimen yang sebelum ini sepenuhnya di luar batas. Selain itu, banyak aspek lain dari cis-Analisis peraturan daripada yang kami pilih untuk menyelidiki dalam kajian ini cenderung untuk mempercepat dengan kaedah yang sama. Sebagai contoh, pelbagai mutasi CRM laman web & # x02013 dapat diperiksa sekaligus dalam satu eksperimen untuk kesannya terhadap output peraturan dan, sekali lagi, perbandingan seperti itu dilakukan dalam satu eksperimen dengan satu set kawalan yang sama menawarkan reka bentuk eksperimen yang unggul.

Beberapa peringatan penting perlu dipertimbangkan. Pertama, terdapat dua aspek penting dari cis-peraturan analisis bahawa perkembangan awal ini tidak menangani. Ia tidak memberikan maklumat ekspresi spasial dan tidak mengesan CRM, yang fungsinya adalah penindasan. Kedua-dua objektif ini, pada prinsipnya, dapat dicapai dengan prosedur throughput tinggi juga, dengan menggunakan prinsip yang serupa, dan kami sekarang hanya terlibat dalam proyek-proyek ini. Lebih serius mungkin adalah ciri fungsional yang wujud dari konstruksi ungkapan pendek, yang merupakan tenaga kerja biasa cis-kajian analisis. Dalam kajian terbaru di makmal kami, kami secara langsung membandingkan fungsi konstruk pendek yang mengandungi yang diberikan cis-modul pengatur dengan aktiviti modul yang sama dalam konteks sistem pengawalseliaan multimodul yang lengkap, menggunakan vektor ekspresi BAC yang dikombinasikan semula (33, 35). Pemerhatian yang tidak biasa dalam perbandingan seperti ini adalah bahawa, dalam konteks, mekanisme pemilihan modul memantapkan penggunaan eksklusif satu modul pada waktu tertentu dan pengecualian yang lain. Walau bagaimanapun, dalam konstruk pendek, di mana tidak ada pilihan, penganjur basal akan menggunakan apa sahaja yang disediakan, dan julat aktiviti konstruk pendek yang diperhatikan melebihi modul yang sama dalam konteks. Ini tentu tidak selalu benar, dan kadang-kadang perbezaan antara ungkapan BAC dari mana modul telah dihapus dan ekspresi kawalan BAC sama dengan ramalan, berdasarkan tingkah laku konstruk pendek yang didorong oleh modul itu. Walau bagaimanapun, kerana pembacaan temporal konstruk pendek mungkin melebihi fungsi normalnya, hasil analisis pada Gambar 4 mesti dianggap hanya menunjukkan kemungkinan batas luar tumpang tindih modul dan bukan sebagai ukurannya. Ini tidak akan mempengaruhi kes di mana modul gen tertentu beroperasi pada masa yang berlainan, kerana ini hanya bermaksud bahawa mereka bertindak balas terhadap input peraturan yang disajikan dalam tahap perkembangan yang berbeza. Begitu juga, konstruksi pendek yang dinyatakan di pelbagai lokasi tertentu adalah petunjuk yang boleh dipercayai mengenai input spasial yang mereka bertindak balas.

Pelbagai CRM setiap Gen.

Gen dalam kajian ini kebanyakannya gen pengawalseliaan, dan pecahan tinggi yang mempunyai banyak CRM tidak mengejutkan. Walau bagaimanapun, kemudahan dengan cepat kita dapat memulihkan beberapa modul per gen wajar mendapat komen. Begitu juga dengan hasil dari St analisis, yang, walaupun diberi peringatan di atas, menunjukkan bahawa biasanya tidak sukar untuk memulihkan CRM yang merangkumi semua fasa aktiviti gen & # x02019s. Teknologi ini cukup kuat sehingga, walaupun tidak ada maklumat pemuliharaan interspesifik, atau tanpa mengira, wilayah intergenik yang besar dapat dibahagikan kepada 3 & # x020135 kb (atau lebih besar) kepingan buta, dan semuanya dapat dinilai dalam satu eksperimen. Walaupun kami tidak berusaha melakukan ini secara sistematik, jalan sekarang terbuka untuk memulihkan apriori semua CRM positif untuk gen yang berminat, dengan memeriksa semua kemungkinan ruang urutan di mana CRM gen itu mungkin wujud. Sudah tentu masalah untuk menentukan gen mana di sekitar CRM yang diatur olehnya memerlukan maklumat lebih lanjut kerana kita terutama tertarik pada gen yang dinyatakan secara khusus, data ekspresi spasial untuk CRM yang baru ditemui di sini sangat penting. Bukti potensi fungsi semua CRM yang membentuk sistem kawalan keseluruhan gen akan sangat berharga ketika dilakukan bersamaan dengan konteks cis- analisis peraturan gen itu. Bukti ini memberikan asas fungsi CRM individu yang berpotensi terhadap mana operasi sistem ketika keseluruhan dapat dibandingkan. Oleh itu, kami percaya bahawa metodologi penemuan CRM yang tinggi dapat menyumbang kepada kemajuan dalam bidang biologi molekul pengawalseliaan yang sangat belum diterokai, tetapi secara konseptual sangat penting, kawalan penggunaan CRM alternatif.

Implikasi dari High-Throughput cis-Metodologi Peraturan untuk Menyelesaikan Rangkaian Peraturan Gen.

Rangkaian peraturan gen pada masa ini diselesaikan dengan kaedah & # x0201ctop down & # x0201d, di mana data gangguan dan ekspresi seluruh sistem digunakan untuk membina model rangkaian. Mengikuti ini, langkah penting adalah mengesahkan hubungan yang diramalkan dalam rangkaian, dengan mengasingkan yang berkaitan cis-modul peraturan dan pengujian fungsi laman web sasaran yang memediasi tindak balas terhadap input peraturan. Namun, sekarang, kita dapat mempertimbangkan pendekatan berdasarkan penggunaan throughput tinggi cis-sistem peraturan ab initio, di mana analisis modular cis-tindak balas peraturan terhadap gangguan ekspresi gen diuji serentak dengan analisis kesan gangguan pada gen endogen. Ini akan menunjukkan yang mana cis-Modul peraturan berkaitan dengan rangkaian yang dimaksud, dan akan sangat membantu dalam membezakan hubungan langsung dari tidak langsung walaupun rangkaian sedang dirumuskan. Di samping itu, prosedur pemerolehan data kuantitatif dan kawalan dalaman yang dimungkinkan oleh sistem tag harus memudahkan analisis komputasi dan statistik seterusnya. Hasilnya akan merevolusikan analisis GRN di mana kaedah ini dapat diterapkan, menghasilkan draf GRN yang sejak awal digunakan cis-trans interaksi untuk menentukan seni bina rangkaian.


Persidangan RECOMB Genomics / Sistem Biologi / DREAM 2010

Untuk tahun ketiga, tiga persidangan mengenai peraturan genetik, biologi sistem dan biologi rangkaian bergabung. Selama lima hari, dari 16 hingga 20 November 2010, pertemuan di Gereja Riverside berhampiran Universiti Columbia menggabungkan Persidangan Satelit RECOMB ke-7 mengenai Genomik Peraturan, yang dipengerusikan oleh Manolis Kellis dan Ziv Bar-Joseph, dengan Persidangan Satelit RECOMB ke-6 mengenai Biologi Sistem dan Persidangan IMPIAN ke-5, dipengerusikan oleh Gustavo Stolovitzky dan Andrea Califano.

Sebagai tambahan kepada ceramah utama yang diringkaskan dalam laporan mesyuarat, persidangan tersebut menampilkan persembahan lisan dan poster karya baru yang menarik dalam bidang dinamik ini. Selanjutnya, Persidangan DREAM menyoroti hasil "Cabaran" pusingan terbaru untuk menilai kemahiran peserta dalam belajar mengenai rangkaian biologi dari data yang dibutakan. Laporan dan video yang lebih terperinci dari persidangan boleh diakses menggunakan bar navigasi di atas.

Gunakan tab di atas untuk mencari laporan mesyuarat dan multimedia dari acara ini.

Pembentangan boleh didapati dari:

Matti Annala (Universiti Teknologi Tampere, Finland)
Nicola Barbarini (Universiti Pavia, Itali)
Harmen Bussemaker (Universiti Columbia)
Alberto de la Fuente (CRS4)
Tom Gingeras (Makmal Pelabuhan Cold Spring)
V & acircn Anh Huynh-Thu (Universiti Li & egravege, Belgium)
Leonid Kruglyak (Universiti Princeton)
Robert K & uumlffner (Ludwig-Maximilians-Universit & aumlt, Munich, Jerman)
Po-Ru Loh (MIT)
Daniel Marbach (Institut Teknologi Massachusetts)
Randall T. Moon (HHMI & amp; Universiti Washington)
Raquel Norel (Penyelidikan IBM)
Yaron Orenstein (Universiti Tel Aviv)
Rob Patro (Universiti Maryland)
Scott Powers (Makmal Pelabuhan Cold Spring)
Bobby Prill (Penyelidikan IBM)
Stuart Schreiber (HHMI, Broad Institute of Harvard dan MIT)
Eran Segal (Institut Sains Weizmann, Israel)
Michael Snyder (Universiti Stanford)
Peter Sorger (Sekolah Perubatan Harvard)
John Stamatoyannopoulos (Universiti Washington)
Hans-J & uumlrgen Thiesen (Universiti Rostock)
Marc Vidal (Sekolah Perubatan Harvard)
Matthieu Vignes (Institut National de la Recherche Agronomique (INRA), Toulouse, Perancis)
Matthew Weirauch (Universiti Toronto)

Imej: Rangkaian kebergantungan filogenetik untuk penyesuaian HIV.
Kredit: Jonathan Carlson dan David Heckerman (Penyelidikan Microsoft).

Disampaikan oleh:

Strategi untuk Mengenal dan Mengesahkan Komponen Baru Rangkaian Transduksi Isyarat

Randall T. Moon (HHMI, Universiti Washington)
    1. Pengenalan rangkaian Wnt-beta-catenin 2. Jalur pemberian isyarat Promosi dan penghambatan Peranan yang bergantung pada konteks pada orang dewasa 3. Pengenalpastian dan pengesahan rangkaian isyarat 4. Skrin Proteomik Skrin molekul kecil 5. Batasan Skrin yang mengagumkan 6. Ringkasan Ucapan terima kasih dan kesimpulan

Transcriptional Lego: Kawalan Ekspresi Gen yang Boleh Diramalkan dengan Memanipulasi Blok Bangunan Promoter

Eran Segal (Institut Sains Weizmann)
    1. Pengenalan 2. Kerangka pemodelan 3. Mengukur ekspresi urutan promoter 4. Pengukuran elemen urutan yang sistematik berbeza-beza 5. Kehadiran, panjang, dan kekuatan sempadan 6. Faktor dan pertalian tapak Tapak TF Kepentingan jarak 7 Penyesuaian tahap ekspresi 8. Pentingnya urutan mengecewakan nukleosom Ucapan terima kasih dan kesimpulan

Merapatkan Jurang dengan Molekul-molekul Kanser Kecil

Stuart Schreiber (HHMI, Broad Institute of Harvard dan MIT)
    1. Pengenalan 2. Pemetaan sensitiviti genotip / SM 3. Menyasarkan pergantungan bersama bukan onkogen Pemodelan 4. Biologi ROS dan kepekaan molekul kecil Rangkaian CTD2 5. Model barisan sel CCLE barah dan kit probe molekul kecil 6. Pengelompokan global kajian data fasa percubaan 7. Ucapan terima kasih dan kesimpulan

Rangkaian Interactome dan Penyakit Manusia

Marc Vidal (Institut Kanser Dana – Farber)
    1. Pengenalan 2. Pendekatan rangkaian dan sifat global Atribut biologi 3. Pemetaan terkawal secara empirikal Meneliti gangguan rangkaian, eksperimen 4. Membandingkan variasi genetik dan patogen 5. Pandangan berpusatkan gen dan berpusat di tepi keluarga Paralogs Actin 6. Evolusi rangkaian interaktif 7. Ucapan terima kasih, ringkasan, dan kesimpulan

Transduksi Isyarat dan Mekanisme Farmaseutikal dari Perspektif Bawah-Atas dan Atas-Bawah

Peter Sorger (Sekolah Perubatan Harvard)
    1. Pengenalan 2. Penskalaan EGFR dan reseptor ErbB Eksperimen ErbB1 3. Peralihan fosfon ErbB2 dan ErbB3 4. Perbezaan dinamik fosfo 5. Pelaksanaan model dan anggaran kadar 6. Konteks rangkaian Kesimpulan perbezaan dalam topologi 7. Membandingkan dan mengelompokkan model Logik kabur pemodelan Pemetaan khusus konteks 8. Ringkasan Peluang Pemberian Penghargaan dan kesimpulan

Pengenalpastian Pemacu Onkogenik dan Biomarker Ramalan dalam Kanser Hati

Scott Powers (Makmal Pelabuhan Cold Spring)
    1. Pengenalan Pilihan rawatan HCC 2. Onkogen yang diaktifkan dalam pemeriksaan cDNA Oncogenomic HCC manusia 3. Algoritma ramalan POFUT1 4. CCND1 dan FGF19 5. Pemeriksaan onkogenomik pada kanser ovari 6. Ucapan terima kasih dan kesimpulan

Genom dan Variasi

Michael Snyder (Universiti Stanford)
    1. Pengenalan Urutan dengan teknologi yang berbeza 2. Pemetaan variasi struktur TF variasi pengikatan dalam ragi 3. Pengikatan Ste12 dan enam faktor baru Trans QTL Amn1 dan Flo8 4. Variasi pengikatan TF di antara orang Variasi yang dapat dilaksanakan 5. Kesimpulan dan pengakuan

Apakah Asas Genetik Variasi Fenotipik?

Leonid Kruglyak (Universiti Princeton)
    1. Pengenalan Ketinggian dan keturunan 2. Membedah fenotip kompleks genetik melalui ragi 3. Kepekaan 4NQO Menilai kesan dan interaksi Perbezaan seni bina 4. Membedah sifat kompleks dalam populasi Corak alel sederhana 5. Ringkasan dan arah masa depan Ucapan terima kasih dan kesimpulan

Transkriptom Eukariotik: Kompleks, Multifungsi, Kompartemen, dan Elegan

Thomas Gingeras (Makmal Pelabuhan Cold Spring)
    1. Pengenalan 2. GENCODE Perubahan dalam data RNAseq 3. Pengkompartemen sub-selular ENCODE projek transkripome IDR 4. Transkrip tanpa catatan Kesimpulan

Mengenal pasti Penentu Genetik Aktiviti TF

Harmen Bussemaker (Universiti Columbia)
    1. Pengenalan Falsafah pemodelan 2. Aspek fungsi TF Mengenal pasti penentu genetik aktiviti faktor TF 3. Identifikasi melalui data interaksi protein-protein 4. Ringkasan dan kesimpulan

Belajar dari Kepelbagaian

Rob Patro (Universiti Maryland)

Ramalan Kereaktifan Peptida dengan IVIg Manusia melalui Pendekatan Berasaskan Pengetahuan

Nicola Barbarini (Universiti Pavia, Itali)

Kaedah Performa Terbaik DREAM5 untuk Ramalan Afiniti Mengikat TF dalam Microarrays PBM

Matti Annala (Universiti Teknologi Tampere, Finland)

Menganalisis Data PBM untuk Mencari Motif Laman Mengikat dan Ramalkan Intensiti Pengikatan TF

Yaron Orenstein (Universiti Tel Aviv)

Pembinaan Semula Rangkaian Pengaturan Gen Menggunakan Rangkaian Bayesian, Pemilih Dantzig, dan Lasso: Analisis Meta

Matthieu Vignes (Institut National de la Recherche Agronomique, Toulouse, Perancis)

Max-Korelasi Min-Redundansi dan Varian Regresi Lain Meramalkan Fenotip dalam DREAM5

Po-Ru Loh (Institut Teknologi Massachusetts)

Kesimpulan Rangkaian Peraturan dengan GENIE3: Aplikasi untuk Cabaran DREAM5

Vân Anh Huynh-Thu (Universiti Liège, Belgium)

Inferens GRN oleh ANOVA

Robert Küffner (Ludwig-Maximilians-Universität, Munich, Jerman)

Epitop – Pengiktirafan Antibodi (EAR)

Hans-Jürgen Thiesen (Universiti Rostock)

Belajar dan Menguji Model Faktor Transkripsi Menggunakan Microarrays Protein Binding

Matt Weirauch (Universiti Toronto)

Cabaran Genetik Sistem DREAM5

Alberto de la Fuente (CRS4)

Kaedah Inferens Rangkaian Profil: Cabaran Inferensi Rangkaian DREAM5

Daniel Marbach (Institut Teknologi Massachusetts)

Hasil DREAM5 Challenge2

Raquel Norel (Penyelidikan IBM)

Hasil DREAM5 Challenge 1: Epitope –Pengiktirafan Antibodi (EAR)

Bobby Prill (Penyelidikan IBM)

Hasil DREAM5 Challenge 3: Genetik Sistem A & B

Bobby Prill (Penyelidikan IBM)

Hasil Cabaran DREAM5 4: [Gene] Rangkaian Kesimpulan

Bobby Prill (Penyelidikan IBM)

Projek, Pangkalan Data, dan Alat

Koleksi Gen Mammalian
Pangkalan data ini memberi para penyelidik akses tanpa had ke klon cDNA pengekod protein penuh yang disahkan mengikut urutan untuk gen manusia, tikus, dan tikus.

Pangkalan Data Mutasi Gen Manusia
Pangkalan data ini mengumpulkan lesi gen yang diterbitkan yang bertanggungjawab terhadap penyakit yang diwarisi oleh manusia.

Atlas Genom Kanser
Cancer Genome Atlas adalah usaha yang komprehensif dan terkoordinasi untuk mempercepat pemahaman kita mengenai genetik kanser menggunakan teknologi analisis genom yang inovatif.

Konsortium Genom Kanser Antarabangsa (ICGC)
ICGC bertujuan untuk mendapatkan penerangan yang komprehensif mengenai perubahan genomik, transkriptomik dan epigenomik dalam 50 jenis tumor dan / atau subtipe berbeza yang mempunyai kepentingan klinikal dan sosial di seluruh dunia.

Portal Laluan Genomik Barah
Portal ini menyediakan muat turun langsung dan visualisasi kumpulan data genomik kanser berskala besar, yang kini merupakan Prostate Cancer, Sarcoma, dan Glioblastoma multiforme. (Video demo)

Rangkaian Penemuan dan Pembangunan Sasaran Kanser (CTD 2)
Jaringan ini bertujuan untuk mengembangkan pendekatan saintifik baru untuk mempercepat terjemahan penemuan genom ke dalam rawatan baru.

ChemBank
ChemBank adalah persekitaran informatika berasaskan web awam, termasuk data yang berasal dari skrin molekul kecil dan molekul kecil, dan sumber untuk mengkaji data.

Projek ENCODE
Projek ENCODE bertujuan untuk mengenal pasti semua elemen berfungsi dalam urutan genom manusia.

Projek GENCODE
Projek GENCODE adalah sub-projek dari projek penambahbaikan ENCODE yang bertujuan untuk memberi penjelasan kepada semua ciri gen berasaskan bukti di seluruh genom manusia dengan ketepatan tinggi

modenkod
modENCODE akan cuba mengenal pasti semua elemen fungsi berdasarkan urutan dalam Caenorhabditis elegans dan Drosophila melanogaster genom.

Konsortium Pemetaan Epigenetics NIH Roadmap
Konsortium Pemetaan Epigenetics NIH Roadmap bertujuan menghasilkan sumber data epigenomik manusia untuk menjadi pemangkin kepada biologi asas dan penyelidikan yang berorientasikan penyakit.

Laluan Commons
Pathway Commons adalah alat untuk mencari dan menggambarkan maklumat laluan biologi awam.

Warisan Mendel dalam Manusia (OMIM)
OMIM adalah kompendium gen manusia dan fenotip genetik yang komprehensif, berwibawa, dan tepat pada masanya.

Pfam
Pfam adalah kumpulan keluarga protein yang besar, masing-masing diwakili oleh penjajaran urutan dan model Markov tersembunyi (HMM)

Penyemak imbas Genom UCSC
Laman web ini mengandungi urutan rujukan dan kumpulan rancangan kerja untuk koleksi genom yang besar.

Projek 1000 Genom
Projek 1000 Genom bertujuan untuk menyusun genom sebilangan besar orang, untuk menyediakan sumber yang komprehensif mengenai variasi genetik manusia.

Katalog Kajian Persatuan Seluruh Genom
Katalog Kajian Seluruh Genom menyenaraikan kajian yang cuba menilai sekurang-kurangnya 100,000 polimorfisme nukleotida tunggal (SNP).

Artikel Jurnal

Steven Altschuler

Altschuler SJ, Angenent SB, Wang Y, Wu LF. Pada kemunculan polaritas sel secara spontan. Alam semula jadi. 2008454(7206):886-889.

Charlie Boone

Costanzo M, Baryshnikova A, Bellay J, et al. Landskap genetik sel. Sains. 2010327(5964):425-431.

Dowell RD, Ryan O, Jansen A, et al. Genotip ke fenotip: masalah yang kompleks. Sains. 2010328(5977):469.

Harmen Bussemaker

TA coklat. Genom. Edisi ke-2. Oxford: Wiley-Liss 2002.

Rockman MV, Kruglyak L. Genetik ekspresi gen global. Nat. Pendeta Genet. 20067(11):862-872.

Tom Gingeras

Leonid Kruglyak

Khan Z, Bloom JS, Garcia BA, Singh M, Kruglyak L. Kuantiti protein di ratusan keadaan eksperimen. Pro. Natl. Acad. Sains. USA. 2009106(37):15544-15548.

Randall T. Moon

MB Utama, Moon RT. Penilaian risiko "Omic". Isyarat Sci. 20092 (72): eg7.

Scott Powers

Chris Sander

Cerami EG, Gross BE, Demir E, et al. Pathway Commons, sumber web untuk data jalur biologi. Asid Nukleik Res. 201139 (Isu pangkalan data): D685-690.

Taylor BS, Barretina J, Socci ND, et al. Perubahan nombor salinan berfungsi dalam barah. PLOS SATU. 20083 (9): e3179.

Stuart Schreiber

Schreiber SL, Shamji AF, Clemons PA, et al. Ke arah terapi barah pesakit. Nat. Bioteknologi. 201028(9):904-906.

Eran Segal

Peter Sorger

Morris MK, Saez-Rodriguez J, Sorger PK, Lauffenburger DA. Model berasaskan logik untuk analisis rangkaian isyarat sel. Biokimia. 201049(15):3216-3224.

Michael Snyder

Alexander RP, Fang G, Rozowsky J, Snyder M, Gerstein MB. Mengenotasi kawasan bukan kod genom. Nat. Pendeta Genet. 201011(8):559-571.

Kasowski M, Grubert F, Heffelfinger C, et al. Variasi faktor transkripsi mengikat di antara manusia. Sains. 2010328(5975):232-235.

John Stamatoyannopoulos

Bernstein BE, Stamatoyannopoulos JA, Costello JF, et al. Konsortium Pemetaan Epigenomik NIH Roadmap. Nat. Bioteknologi. 201028(10):1045-1048.

Marc Vidal

Goh K, Cusick ME, Valle D, et al. Rangkaian penyakit manusia. Pro. Natl. Acad. Sains. USA. 2007104(21):8685-8690.

Cabaran IMPIAN

Candès dan Tao. 2007. Pemilih Dantzig: anggaran statistik apabila p jauh lebih besar daripada n. Ann. Stat.35:2313-2351.

Friedman N, Linial M, Nachman I, Pe'er D. Menggunakan rangkaian Bayesian untuk menganalisis data ekspresi. J. Komput. Biol. 20007(3-4):601-620.

Margolin AA, Wang K, Lim WK, et al. Rangkaian selular kejuruteraan terbalik. Nat Protoc. 20061(2):662-671.

Prosedur Tiengo A, Barbarini N, Troiani S, Rusconi L, Magni P. A Perl untuk pengenalpastian protein oleh Peptide Mass Fingerprinting. Bioinformatik BMC. 200910 Suppl 12: S11.

Penganjur

Ziv Bar-Joseph, PhD

Ziv Bar-Joseph adalah Profesor Madya di Lane Center for Computational Biology di Carnegie Mellon University. Sebelum memulakan jawatan akademik ini, Bar-Joseph menghabiskan 4 tahun (1999–2003) di Cambridge, Massachusetts memperoleh gelar PhD dalam sains komputer di bawah bimbingan David Gifford dan Tommi Jaakkola. Dia melakukan pekerjaan sarjana dan sarjana di universiti Ibrani, memperoleh BSc dalam sains komputer dan matematik dan kemudian M Sc dalam sains komputer.

Karyanya di Carnegie Mellon adalah dalam biologi komputasi, bioinformatik dan pembelajaran mesin. Bar-Joseph juga mengetuai kumpulan biologi sistem di mana para penyelidik mengembangkan kaedah komputasi untuk memahami interaksi, dinamika dan pemuliharaan sistem biologi yang kompleks. Sebilangan karya sebelumnya telah memfokuskan pada bidang menarik pengkomputeran dan grafik komputer yang diedarkan.

Andrea Califano, PhD

Andrea Califano adalah profesor informatika bioperubatan di Universiti Columbia, di mana dia memimpin beberapa aktiviti merentas kampus dalam bidang komputer dan biologi sistem. Califano juga merupakan pengarah kod Pusat Biologi Komputasi dan Bioinformatik, pengarah Pusat Analisis Multiskala Jaringan Genetik, dan pengarah bersekutu untuk bioinformatik di Pusat Penyelidikan Kanser Irving.

Califano menyelesaikan tesis kedoktorannya dalam bidang fizik di University of Florence dan mengkaji tingkah laku sistem dinamik dimensi tinggi. Dari tahun 1986 hingga 1990, dia menjadi staf penyelidikan di Kumpulan Eksploratori Komputer Penglihatan di Pusat Penyelidikan IBM Thomas J. Watson, di mana dia mengusahakan beberapa algoritma untuk pembelajaran mesin, termasuk penafsiran pemandangan visual dua dan tiga dimensi. Pada tahun 1997, dia menjadi pengarah program Pusat Biologi Komputasi IBM, dan pada tahun 2000 dia mendirikan First Genetic Trust, Inc., untuk melanjutkan penyelidikan genomik translasi dan aktiviti berkaitan infrastruktur dalam konteks kajian pesakit berskala besar dengan komponen genetik.

Manolis Kellis, PhD

Manolis Kellis adalah Profesor Sains Komputer di MIT dan anggota Makmal Sains Komputer dan Kecerdasan Buatan dan Institut Luas MIT dan Harvard, di mana dia mengarahkan Kumpulan Biologi Komputasi MIT. Kumpulannya baru-baru ini dibiayai untuk memimpin usaha analisis integratif projek modENCODE untuk Drosophila melanogaster dan juga untuk analisis integratif Projek Peta Jalan Epigenome NIH. Dia telah menerima Anugerah Kerjaya Awal Presiden AS dalam Sains dan Kejuruteraan (PECASE) untuk karya NIH R01 dalam Computational Genomics, anugerah NSF CAREER, Alfred P. Sloan Fellowship, kerusi Karl Van Tassel di EECS, kerusi Alumnus Cemerlang 1964 , dan Anugerah Pengajaran Ruth dan Joel Spira di EECS. Kellis memperoleh PhD dari MIT, di mana dia menerima anugerah Sprowls untuk tesis doktor terbaik dalam sains komputer, dan persekutuan lulusan Paris Kanellakis pertama. Sebelum biologi komputasi, dia bekerja pada kecerdasan buatan, lakaran dan pengenalan gambar, robotik, dan geometri komputasi, di MIT dan di Pusat Penyelidikan Xerox Palo Alto.

Gustavo Stolovitzky, PhD

Gustavo Stolovitzky adalah pengurus Kumpulan Biologi Fungsi Genomik dan Sistem di Pusat Biologi Komputasi IBM dalam Penyelidikan IBM. Kumpulan Fungsi Genomik dan Biologi Sistem terlibat dalam beberapa projek, termasuk analisis cip DNA dan perlombongan data ekspresi gen, kejuruteraan terbalik rangkaian pengatur metabolik dan gen, memodelkan otot jantung, menggambarkan sifat-sifat myofilamen yang muncul, memodelkan jalur isyarat P53, dan melakukan analisis penjujukan tandatangan selari secara besar-besaran.

Stolovitzky memperoleh PhD dalam bidang kejuruteraan mekanikal dari Universiti Yale dan bekerja di The Rockefeller University dan di Institut Penyelidikan NEC sebelum datang ke IBM. Dia pernah berkhidmat sebagai Profesor Jemputan Joliot di Laboratoire de Mecanique de Fluides di Paris dan sebagai sarjana pelawat di jabatan fizik The Chinese University of Hong Kong. Stolovitzky adalah ahli jawatankuasa pemandu di Kumpulan Perbincangan Biologi Sistem dari Akademi Sains New York.

Penceramah

Steven Altschuler, PhD
Matti Annala

Universiti Teknologi Tampere, Finland
e-mel

Nicola Barbarini, PhD
Charlie Boone, PhD
Harmen Bussemaker, PhD
Alberto de la Fuente, PhD
Tom Gingeras, PhD
Vân Anh Huynh-Thu
Leonid Kruglyak, PhD
Robert Küffner, PhD

Ludwig-Maximilians-Universität, Munich, Jerman
e-mel | laman web | penerbitan

Po-Ru Loh
Randall T. Moon, PhD
Raquel Norel, PhD
Yaron Orenstein
Rob Patro
Scott Powers, PhD

Makmal Cold Spring Harbor
e-mel | laman web

Bobby Prill, PhD
Chris Sander, PhD

Pusat Kanser Memorial Sloan-Kettering, Institut Sloan-Kettering
e-mel | laman web | penerbitan

Stuart Schreiber, PhD

HHMI, Broad Institute of Harvard dan MIT
e-mel | laman web | penerbitan

Eran Segal, PhD

Institut Sains Weizmann, Israel
e-mel | laman web | penerbitan

Michael Snyder, PhD
Peter Sorger, PhD
John Stamatoyannopoulos, PhD
Gustavo Stolovitzky, PhD
Marc Vidal, PhD
Matthieu Vignes, PhD

Institut National de la Recherche Agronomique (INRA), Toulouse, Perancis
e-mel | laman web | penerbitan

Matthew Weirauch, PhD
Don Monroe

Don Monroe adalah seorang penulis sains yang berpusat di Murray Hill, New Jersey. Setelah memperoleh PhD dalam bidang fizik dari MIT, dia menghabiskan lebih dari lima belas tahun untuk melakukan penyelidikan dalam bidang fizik dan teknologi elektronik di Bell Labs. Dia menulis mengenai biologi, fizik, dan teknologi.

Penaja

Untuk tahun ketiga, tiga persidangan mengenai peraturan genetik, biologi sistem dan biologi rangkaian bergabung. Selama lima hari, pertemuan di Gereja Riverside berhampiran Universiti Columbia menggabungkan Persidangan Satelit RECOMB ke-7 mengenai Genomik Peraturan, yang dipengerusikan oleh Manolis Kellis dan Ziv Bar-Joseph, dengan Persidangan Satelit RECOMB ke-6 mengenai Sistem Biologi dan Persidangan IMPIAN ke-5, dipengerusikan oleh Gustavo Stolovitzky dan Andrea Califano.

Sebagai tambahan kepada ceramah utama yang diringkaskan di bawah, persidangan tersebut menampilkan persembahan lisan dan poster karya baru yang menarik dalam bidang dinamik ini. Di samping itu, Persidangan DREAM menyoroti hasil "Cabaran" pusingan terbaru untuk menilai kemahiran peserta dalam belajar mengenai rangkaian biologi dari data yang dibutakan.

Isyarat

Corak ekspresi sel bergantung sebahagiannya pada konteks selular yang disediakan oleh jalur isyarat seperti jalur Wnt dan ErbB, yang masing-masing terlibat dalam kanser. Rangsangan jalur isyarat Wnt yang serba boleh mempunyai kesan yang sangat berbeza, bergantung pada kapan dan di mana ia berlaku. Untuk mencari molekul yang mengawal kepekaan ini, Randall Moon menggunakan pengujian embrio katak dan ikan dan ujian berasaskan sel menggunakan siRNA, proteomik, dan molekul kecil. Menggabungkan hasil dari skrin ini membantu mengimbangi kelemahan masing-masing, tetapi beberapa langkah pengesahan masih kritikal, katanya. Peter Sorger mengintegrasikan eksperimen dan model isyarat, termasuk yang terdapat di jalur ErbB, pada pelbagai peringkat terperinci. Model Sorger berkisar dari persamaan pembezaan untuk dinamik terperinci hingga model Boolean untuk rangkaian besar. Dia mencatat konflik yang wujud antara tahap perincian biologi dan kemampuan untuk menentukan parameter model.

Kanser

Kanser hati menunjukkan perubahan yang meluas dalam jumlah salinan gen. Scott Powers meneroka kawasan genom yang sering diperkuat dalam barah ini dan menemui 18 gen yang ekspresi berlebihan menyebabkan barah hati pada model tikus. Gen ini mungkin berguna sebagai biomarker untuk laluan yang terganggu pada tumor tertentu. Projek genom barah menunjukkan bahawa mutasi pada setiap pesakit adalah berbeza, tetapi cenderung mempengaruhi kumpulan laluan yang sama. Chris Sander berpendapat terapi terbaik akan mengenali modul-modul biasa ini tetapi menggunakan kombinasi ubat-ubatan yang ditujukan untuk subkumpulan pesakit tertentu.

Heterogeniti

Heterogenitas dalam populasi sel ada di mana-mana, kata Steven Altschuler, dan selalunya penting secara biologi. Kerana sel individu mungkin berperilaku sama sekali berbeza dari rata-rata populasi, para penyelidik perlu membenarkan penggunaan rata-rata mereka. Mengakui penyebaran heterogen RNA yang ditranskrip dalam petak subselular yang berlainan, kata Thomas Gingeras, membolehkan penyelidik menemui transkrip yang jarang berlaku. Kira-kira separuh daripada genom ditranskrip dan diproses, katanya, dan tampaknya merangkumi banyak jenis RNA yang fungsinya belum difahami.

Gangguan

Analisis tindak balas sel terhadap molekul kecil, kata Stuart Schreiber, memberikan gambaran biologi mengenai proses selular serta potensi untuk terapi. Dia dan rakannya secara sistematik membuat katalog hubungan tindak balas dos untuk panel molekul yang sangat spesifik, yang bersama-sama dengan pencirian genetik sel harus menyediakan alat penting untuk menerjemahkan sains ke dalam rawatan. Marc Vidal mengatakan bahawa peningkatan pemetaan dan pemahaman rangkaian seperti interaksi protein memberikan pandangan biologi yang penting. Lebih daripada separuh mutasi yang membawa kepada penyakit manusia nampaknya mengubah cara makromolekul berinteraksi, daripada melumpuhkan spesies molekul individu. Mutasi "edgetic" ini dapat membantu menjelaskan hubungan erat antara banyak penyakit.

Interaksi genetik

Corak interaksi genetik, seperti mana pasangan gen menunjukkan kepincangan sintetik apabila kedua-duanya dihapus, memberikan gambaran kuat mengenai fungsinya, kata Charlie Boone. Dia dan kolaboratornya menggunakan analisis kuantitatif untuk menilai semua 18 juta kemungkinan mutan ganda dari 6000 gen ragi, dan membangun rangkaian berdasarkan hasilnya. Tetapi kebolehubahan semula jadi jauh lebih rumit, kerana varian gen biasanya mempunyai kesan kecil dan muncul dengan latar belakang variasi gen lain. Latar belakang dapat mengubah kesan varian dan mencampuradukkan usaha untuk mengesan sifat-sifat yang boleh diwariskan kepada varian individu. Leonid Kruglyak telah mengembangkan kaedah untuk memetakan semua lokus genetik yang menyumbang kepada sifat pemboleh ubah yang berterusan, mendedahkan banyak lokus dan interaksi kompleks di antara mereka.

Peraturan seluruh genom

Perbezaan dalam interaksi pengawalseliaan, khususnya dalam mengikat faktor transkripsi, berada di belakang banyak variasi individu dan juga penyakit, kata Michael Snyder. Perbezaan urutan yang mendasari variasi pengikatan sering tidak mempengaruhi motif faktor transkripsi itu sendiri, tetapi kofaktor lain yang sama pentingnya untuk beberapa gen yang mereka atur. Kebolehaksesan keseluruhan DNA ke molekul pengawalseliaan dapat dipetakan menggunakan endonuclease DNase I, kata John Stamatoyannopoulos, dan corak pengikatannya terhadap genom mencerminkan garis keturunan perkembangan. Pada tahap satu nukleotida, belahan memberikan cap jari tertentu untuk setiap faktor transkripsi.

Interaksi DNA & ndashprotein

Organisasi nukleosom dan faktor transkripsi banyak dijelaskan oleh pertalian urutannya, kata Eran Segal. Pasukannya telah mengembangkan ujian ekspresi kuantitatif untuk menilai kesan perubahan urutan, termasuk kesan dramatik urutan poli-adenosin yang kaku dalam menghalang pembentukan nukleosom dan dengan itu membenarkan faktor transkripsi masuk ke DNA. Perkaitan protein yang dikira dengan DNA harus merangkumi pergantungan antara kedudukan yang berbeza, kata Harmen Bussemaker, seperti yang ditunjukkan oleh pembelahan DNA yang bergantung kepada urutan oleh DNase I. Menggunakan pertalian yang diramalkan membolehkan para penyelidik mengekstrak secara tepat faktor penentu gen transkripsi.

Cabaran IMPIAN

DREAM mencabar kaedah menilai secara kritis untuk membuat pemotongan mengenai sistem biologi dari data throughput tinggi. Kerana kepelbagaian teknik pengukuran dan masalah biologi, pelbagai cabaran disesuaikan dan disesuaikan dari tahun ke tahun.

Tahun ini, penganjur bersama untuk menghadapi cabaran tersebut Gustavo Stolovitzky, Robert Prill, dan Julio Saez-Rodriguez. Pemarkahan dipimpin oleh Prill dan Raquel Norel, dengan sokongan laman web dari Tom Garben. Terdapat empat cabaran untuk DREAM5.

The Cabaran Pengiktirafan Epitope-Antibodi (EAR) memerlukan pasukan untuk meramalkan peptida mana yang akan bertindak balas dengan panel antibodi, berdasarkan kereaktifan diketahui kumpulan peptida yang serupa. Data dikumpulkan oleh Hans-Juergen Thiessen dan rakan-rakannya. Pasukan berprestasi terbaik, yang diwakili oleh Rob Patro dan Nicola Barbarini kedua-dua klasifikasi mesin terpakai berdasarkan terutamanya pada banyak ciri data urutan peptida.

The Cabaran Pengiktirafan Motif Transkripsi-DNA-Motif data dikumpulkan oleh Matt Weirauch dan Tim Hughes dari Protein-Binding Microarrays (PBM). Cabaran utama adalah untuk memprediksi pilihan mengikat faktor transkripsi ke rangkaian urutan DNA yang luas, berdasarkan spesifisitas yang diukur dari sekumpulan latihan faktor transkripsi. Cabaran bonus adalah untuk mengenal pasti faktor transkripsi yang dinyatakan dalam setiap eksperimen. Pasukan yang berprestasi terbaik untuk cabaran utama, yang diwakili oleh Matti Annala, menggunakan model pertalian linear berdasarkan urutan pendek yang paling bermaklumat. Pasukan itu berkongsi gelaran berprestasi terbaik untuk pusingan bonus dengan pasukan yang diwakili oleh Yaron Orenstein menggunakan pencari motif Amadeus, juga berdasarkan urutan pendek yang paling bermaklumat.

The Cabaran Genetik Sistem menggunakan jenis data yang muncul dari persilangan antara dua strain tulen yang sangat berbeza. Salib menghasilkan sebilangan besar keturunan yang berbeza, masing-masing dengan genotip yang mempunyai satu atau alel ibu bapa yang lain untuk setiap gen. Data dikumpulkan oleh Alberto de la Fuente dan rakan-rakannya. Bahagian A dari cabaran ini menggunakan data simulasi dari rangkaian 1000-gen dengan kedua-duanya cis dan trans variasi genetik. Pasukan yang berprestasi terbaik, diwakili oleh Matthieu Vignes, menggunakan beberapa algoritma yang berbeza dan menggabungkan hasilnya. Bahagian B menggunakan data eksperimen untuk ketahanan acuan pada kacang soya. Pasukan berprestasi terbaik, yang diwakili oleh Po-Ru Loh, menggunakan transformasi susunan peringkat untuk mengelakkan diri daripada diliputi oleh penyekat ekstrem, dan memasukkan kombinasi logik Boolean untuk menjelaskan kemungkinan interaksi antara gen.

The Cabaran Inferensi Rangkaian mewakili cabaran berulang pada pertemuan DREAM, untuk menyimpulkan rangkaian gen dari tahap ekspresi di berbagai keadaan yang terganggu. Daniel Marbach, Jim Costello, Diogo Camacho, dan Jim Collins mengumpulkan data. Mereka memasukkan data dari yang terkenal dalam silico rangkaian, seperti pada cabaran DREAM sebelumnya, tetapi juga tiga set data biologi. Ragi dan E coli data dijaring berdasarkan rangkaian yang diterima dengan baik untuk spesies tersebut. Sebaliknya, data untuk Staphylococcus aureus tidak dijaringkan tetapi akan digunakan untuk menghasilkan ramalan komuniti, kerana tidak ada rangkaian yang diterima untuk mikroba ini. Pemain terbaik keseluruhan dan dalam silico diwakili oleh V & acircn Anh Huynh-Thu, dan, seperti dalam analisis prestasi terbaik mereka dari DREAM4, menggunakan model keputusan-keputusan. Pelakon terbaik untuk dalam vivo data, yang diwakili oleh Robert K & uumlffner, juga merupakan ulangan dari DREAM4, dan menggunakan ujian ANOVA.

Kemasukan data biologi dan simulasi secara bersebelahan merupakan kematangan penting cabaran DREAM, dan dapat membantu mereka mendapatkan lebih banyak perhatian dari ahli biologi untuk kaedah inferensi ini.

Penceramah:
Randall Moon, Universiti Washington
Peter Sorger, Sekolah Perubatan Harvard dan Institut Teknologi Massachusetts

Sorotan

  • Jalur isyarat Wnt terlibat dalam banyak proses, termasuk pengembangan embrio dan regenerasi sel, tetapi kesannya sangat berbeza dengan konteks sel.
  • Ujian berasaskan sel berskala besar, termasuk penurunan siRNA, jaringan proteomik, dan skrin molekul kecil memberikan petunjuk penting mengenai gen dan protein mana yang memodulasi isyarat pada jalur ini.
  • Penyatuan data dari pelbagai skrin mengenal pasti calon dengan lebih tepat daripada analisis tunggal, tetapi pelbagai tahap pengesahan masih penting untuk memastikan kesimpulan yang tepat.
  • Pengukuran dinamik jalur isyarat Erb menunjukkan pergantian keadaan fosforilasi yang cepat yang berbeza dengan masa pemulihan lama yang normal, dan sangat penting untuk pemodelan tindak balas ubat.
  • Terdapat konflik yang wujud antara pemodelan biologi komprehensif dan kemampuan untuk menentukan nilai parameter, tetapi memilih eksperimen yang paling bermaklumat dapat meningkatkan kecekapan proses ini.
  • Pemodelan rangkaian berskala besar memerlukan pendekatan seperti logik Boolean atau kabur yang lebih efisien daripada persamaan pembezaan yang lengkap.

Membedah isyarat Wnt

Isyarat biologi menentukan konteks biologi di mana program genetik dijalankan. Sepanjang 25 tahun mempelajari jalur isyarat Wnt, Randall Moon telah mengetahui pentingnya pemeriksaan bebas mengenai kepentingan biologi. "Pelbagai tahap pengesahan sangat penting," katanya, terutamanya ketika para penyelidik menggunakan alat throughput tinggi baru yang menghasilkan banyak calon molekul untuk berperanan di jalan.

Reseptor Wnt transmembran memulakan isyarat yang mempengaruhi pelbagai proses. Dalam perkembangan, misalnya, isyarat ini adalah pusat organisasi dan tisu, sehingga embrio katak mengembangkan kepala kedua sebagai tindak balas terhadap isyarat Wnt yang luar biasa. Pada orang dewasa, jalan penting untuk pertumbuhan semula dan homeostasis sel stem, sementara isyarat Wnt yang berlebihan membawa kepada pelbagai tumor.

"Isyarat tidak boleh mempunyai beberapa kesan yang berbeza-beza bergantung pada kapan dan di mana ia dinyatakan," Moon menekankan, menghasilkan perubahan yang hampir bertentangan dalam sel yang sama yang usianya berbeza hanya beberapa jam. "Ciri utama isyarat Wnt adalah bergantung kepada konteks."

"Pengendalian utama jalur ini berpusat di sekitar peraturan kestabilan protein & beta-catenin," katanya, yang bertindak dengan melakukan translokasi ke inti untuk mengubah transkripsi. & aktiviti beta-catenin diatur oleh ubiquitination, yang mensasarkan protein untuk penurunan protein. Isyarat tidak menghalang keberadaan ini.

Banyak eksperimen Moon dilakukan dengan embrio, misalnya katak dan zebra, di mana dia menyatakan bahawa "jalur isyarat Wnt digunakan dalam konteks yang benar-benar normal" dalam pelbagai tisu. Untuk mengenal pasti pelakon calon lain dalam isyarat Wnt, Moon menggunakan ujian berasaskan sel, seperti penurunan siRNA, proteomik, dan ujian molekul kecil. Namun, tegasnya, adalah penting "untuk memaksimumkan kesahihan hits, agar anda tidak menghabiskan seluruh masa anda untuk mengejar hit yang tidak disasarkan."

Moon menggambarkan skrin siRNA berdasarkan wartawan luciferase yang dioptimumkan untuk kehadiran & beta-catenin, yang dalam satu jenis sel menghasilkan 804 hits dari 22,325 perpustakaan gen. Skrin sekunder, yang menggunakan tiga siRNA tambahan untuk setiap gen dan memerlukan tindak balas dalam beberapa baris sel, mengurangkan jumlah calon menjadi 310. Skrin ketiga, yang mengukur ekspresi gen endogen, bukan hanya wartawan eksogen, memukul jumlahnya menjadi 63 gen.

Pengesahan akhir mencari sama ada fenotip mutan Wnt stereotaip pada embrio zebrafish atau analisis proteomik yang menempatkan gen dalam rangkaian interaksi protein & ndashprotein dengan elemen lain dari jalur Wnt / & beta-catenin. Dalam satu contoh, proses ini mengenal pasti AGGF1, yang "diperlukan untuk memodulasi kira-kira separuh daripada gen sasaran & beta-catenin," kata Moon.

Dalam kejayaan serupa, skrin proteomik mencadangkan protein penekan tumor WTX berinteraksi dengan & beta-catenin. Untuk memeriksa ramalan ini, pasukan Moon mengesahkan bahawa WTX rekombinan berinteraksi dengan & beta-catenin, mungkin meningkatkan keberadaannya dan dengan itu mengekalkan tahapnya rendah. "Apa sahaja yang keluar dari layar proteomik atau layar siRNA, akhirnya anda perlu mendorongnya ke tahap pemahaman biokimia," tegasnya.

Dalam ujian berasaskan sel ketiga, Moon berkata, "kami menggunakan skrin molekul kecil untuk mengembangkan terapi yang berpotensi, tetapi juga untuk mengenal pasti komponen jalur isyarat." Meneliti perpustakaan sebatian, serupa dengan yang dijelaskan oleh Stuart Schreiber, mengenal pasti ubat yang diluluskan oleh FDA bernama Riluzole. Reseptor glutamat GRM1 yang disasarkan ubat ini sebelumnya tidak dikenali dalam & beta-catenin memberi isyarat, jadi teknik ini menunjukkan biologi baru dan juga terapi yang berpotensi. "Menggunakan skrin molekul kecil untuk mengenal pasti komponen jalur isyarat sangat kuat," kata Moon.

Walaupun setiap ujian berasaskan sel berguna dengan sendirinya, "mengintegrasikan teknik ini adalah cara ampuh untuk mengimbangi kekurangan satu skrin," kata Moon. "Batasan terbesar siRNA adalah mereka memberikan banyak klik di luar sasaran, dan juga bahawa anda tidak mendapat gambaran mengenai mekanisme isyarat," sedangkan proteomik memberi anda "banyak data tetapi sama sekali tidak ada petunjuk jika klik anda berfungsi." Sekiranya penyelidik menetapkan ambang tinggi untuk kepentingan dalam ujian ini, mereka berisiko kehilangan calon yang menjanjikan.Dengan menggabungkan layar siRNA dan molekul kecil, Moon dan rakannya mengenal pasti kinase tertentu sebagai penyumbang laluan Wnt / & beta-catenin, dan mengesahkannya menggunakan spektrometri massa.

Dinamika isyarat pemodelan

Analisis lengkap mengenai isyarat memerlukan mengetahui bukan hanya molekul yang berinteraksi, tetapi perincian bagaimana mereka saling mempengaruhi. Peter Sorger menerangkan beberapa usaha pasukannya untuk membuat model yang lebih lengkap pada beberapa peringkat penerangan yang berbeza.

Satu projek melibatkan pengukuran dinamika reseptor faktor pertumbuhan epidermis (EGFR, juga disebut ErbB1 dan Her1). Pengikatan EGF ekstraselular ke molekul transmembran ini menyebabkannya menjadi homo-dimerize atau hetero-dimerize dengan anggota keluarga ErbB lain, yang sering menjadi sasaran terapi barah. Dimer kemudiannya difosforilasi, yang memungkinkannya menyambungkan protein intraselular yang mempunyai domain mengikat SH2 atau PTB dan mengaktifkannya untuk memberi isyarat selanjutnya.

"Ini adalah kelas protein yang difahami dengan baik," kata Sorger, dan kajian menunjukkan bahawa penyesuaian terhadap ligan berterusan selama beberapa jam. Beberapa ubat menghalang tindak balas reseptor, beberapa dengan mengikat ke poket ATP ErbB1. Anehnya, sebagai tindak balas terhadap salah satu ubat ini, gefitinib, reseptornya disfosforilasi dalam puluhan saat, bukan berjam-jam. "Itu adalah reaksi deposforilasi yang lebih cepat daripada yang kita bayangkan," kata Sorger. Rakan pengikat ErbB2 atau ErbB3, serta Shc dan protein hiliran lain, juga cepat disfosforilasi.

Para penyelidik berjaya memodelkan tingkah laku ini dengan menggunakan persamaan pembezaan yang menyumbang kepekatan latar belakang ATP yang sangat tinggi. "Ubat-ubatan ini berusaha mendapatkan akses ke poket pengikat mereka di hadapan pesaing 2 milimolar, yang merupakan salah satu masalah terbesar mereka secara terapeutik," kata Sorger.

Untuk memodelkan kesan ubat lain, lapatinib, memerlukan model yang lebih canggih dengan 47 persamaan pembezaan biasa yang merangkumi peralihan reseptor ke konfigurasi yang tidak aktif. "Perolehan pantas diperlukan untuk melihat perbezaan antara kedua ubat tersebut," kata Sorger. "Melihat apa yang nampaknya biologi berusia 25 tahun dalam suasana dinamik yang sederhana telah menyebabkan anggapan bahawa sebenarnya sinosom ini sangat dinamik."

Semakin kompleksnya model ini, walaupun berdasarkan biologi, menimbulkan "pertukaran yang tidak dapat dielakkan," kata Sorger. "Ketika kita semakin canggih dengan hipotesis yang mendasarinya, kita mengalami kesukaran yang lebih besar untuk membangun kerangka yang ketat untuk kesimpulan di masa depan." Pasukan Sorger mengatasi masalah ini sebahagiannya dengan memperoleh julat nilai statistik dan bukannya nilai tepat yang menipu.

Membandingkan model untuk empat barisan sel barah: Model yang paling cekap untuk mewakili tindak balas empat garis sel barah yang berbeza mempunyai perbezaan yang signifikan dalam interaksi mereka (anak panah berwarna berbeza).

Postdoc William Chen menganalisis sejauh mana percubaan RNAi yang berbeza menentukan parameter untuk topologi rangkaian yang diketahui. Dia mendapati bahawa memilih spesies yang paling bermaklumat untuk knockdown, berdasarkan analisis terperinci, jauh lebih berkesan daripada memilih eksperimen secara rawak. "Tiga eksperimen terbaik lebih baik, rata-rata, daripada 25 RNAi yang dipilih secara rawak," kata Sorger, walaupun pilihan terbaik "jelas tidak intuitif" walaupun rangkaian itu diketahui. Menggabungkan RNAi dengan eksperimen lain adalah lebih berkesan.

Walaupun model isyarat matematik terperinci sangat berguna, kesukaran dalam menentukan parameter menjadikan tahap perincian ini tidak praktikal untuk rangkaian yang lebih komprehensif. Salah satu manifestasi kesukaran ini adalah kurangnya konsensus mengenai topologi rangkaian, kata Sorger. "Bergantung pada tempat anda pergi dalam kesusasteraan, anda akan menemui idea yang berbeza tentang bagaimana rupa rangkaian."

Sorger dan rakan sekerjanya telah secara meluas mencirikan sistem eksperimen yang terdiri daripada kultur sel hati manusia primer dan barisan sel barah hepatik. Mereka memaparkan garis-garis ini kepada banyak gangguan dan mengukur banyak tindak balas, seperti pengeluaran sitokin dan reaksi dengan antibodi khusus fosfo.

Dalam memodelkan sistem ini, Julio Saez-Rodriguez mengumpulkan jaringan konsensus dari maklumat dalam literatur dan kemudian memperbaiki model berdasarkan eksperimen. Konsensus itu "salah sebagian kecil masa itu," kata Sorger, terutama kerana literatur menunjukkan hubungan yang tidak mempunyai sokongan dalam eksperimen. Dengan menggunakan penerangan dua keadaan logik yang mudah untuk simpul, dan menghukum kerumitan tambahan, para penyelidik berpuas hati kerana mendapati data tersebut dapat digambarkan oleh model yang jauh lebih sederhana daripada yang mereka mulakan. Model yang dihasilkan, dibina secara berasingan untuk setiap jenis sel, membolehkan pasukan menentukan bagaimana garis sel primer dan tumor berbeza dalam topologi rangkaian.

Pasukan Sorger juga berusaha merapatkan model matematik terperinci dan model Boolean yang dipermudah dengan melihat keterangan "logik kabur". "Logik kabur membolehkan anda mengambil peralihan on-off lurus dalam logik diskrit dan sebaliknya mengkodkannya sebagai peralihan bertahap," katanya, tetapi masih agak efisien.

Penceramah:
Scott Powers, Makmal Cold Spring Harbor
Chris Sander, Pusat Kanser Memorial Sloan-Kettering

Sorotan

  • Penghapusan dan penyisipan yang sering dikesan dalam analisis genetik tumor hati dapat menunjukkan kemungkinan gen pelindung dan onkogen.
  • Memulihkan tikus dengan cDNA dari gen yang diperkuat tersebut mengesahkan 18 onkogen yang diketahui dan baru.
  • Gen-gen ini mungkin lebih berguna untuk menuju ke biomarker yang menunjukkan jalan isyarat mana yang terganggu pada pesakit tertentu, dan bukan sebagai sasaran terapi langsung.
  • Analisis genetik menunjukkan bahawa pesakit yang nampaknya mempunyai barah yang sama sering mempunyai mutasi spesifik yang berbeza, tetapi mutasi ini masing-masing mengganggu modul biasa.
  • Terapi gabungan yang disesuaikan dengan variasi individu mungkin merupakan kaedah terbaik untuk mengatasi barah.
  • Untuk rangkaian yang besar, pertama-tama menyimpulkan sifat statistik dan kemudian memilih contoh khusus mungkin lebih berkesan daripada membuat generalisasi dari penyelesaian individu.

Mencari onkogen baru dalam barah hati

Perubahan genetik adalah ciri biasa dalam barah, dan menjadikannya lebih pelbagai dan sukar untuk dirawat. Projek baru-baru ini, termasuk Cancer Genome Atlas dan International Cancer Genome Consortium secara meluas mencirikan variasi genetik dalam beberapa barah dengan harapan dapat menemui ciri umum dan cara baru untuk mengubatinya.

Dalam barah hati, dari gen barah terkenal yang disasarkan oleh terapi yang ada, "tidak ada yang benar-benar bermutasi dengan kekerapan apa pun," kata Scott Powers. Dia dan rakannya telah menggunakan data genom barah untuk mencari gen calon baru untuk terapi atau untuk biomarker baru untuk memandu terapi.

"Kira-kira 80% kanser hati mempunyai variasi bilangan salinan DNA yang luas," kata Powers. Dia dan rakannya di Cold Spring Harbor, Scott Lowe sebelumnya melihat kawasan yang sering dihapuskan dalam barah untuk mengenal pasti gen pelindung menggunakan eksperimen RNA pendek. Dalam karyanya saat ini, Powers mengatakan, "kami mengambil wilayah yang diperkuat dan melihat untuk melihat wilayah mana yang mengandung onkogen, bukan dengan merobohkannya dengan RNAi tetapi dengan mengekspresikannya secara berlebihan menggunakan cDNA." Menggunakan urutan yang disahkan dari Koleksi Gen Mammalian, pasukannya memindahkan hepatosit tikus yang telah diubah suai menjadi rentan terhadap barah. Dalam sel-sel ini, penekan tumor p53 hilang dan onkogen Myc terlalu banyak dinyatakan & mdash "dua perubahan genetik yang sangat biasa dalam barah hati."

Sel yang dipindahkan dengan calon onkogen disuntik ke limpa. "Sekiranya anda melakukan ini dengan teliti, anda akan mendapat penyebaran sel ke seluruh hati" melalui sistem darah, kata Powers. Dari 124 cDNA yang dipilih untuk ekspresi berlebihan dalam kanser, 18 menghasilkan barah hati baru dalam model tikus ini.

Sebagai tambahan, gen dari kawasan kecil yang diperkuat cenderung menjadi onkogen sejati, bukannya "penumpang." Untuk wilayah terkuat terbesar, lebih dari 10 megabase, kemungkinan gen menjadi pemacu tidak jauh lebih tinggi daripada set kawalan, kata Powers. "Di masa depan, untuk melampaui amplicons kecil ini, kita harus mengembangkan pendekatan hibrid pemilihan komputasi."

"Ini adalah sekumpulan data cDNA onkogen terbesar yang pernah dibangun," kata Powers, sehingga para penyelidik dapat memeriksa pendekatan komputasi mana yang mungkin telah meramalkan onkogen. Mereka mendapati bahawa baik tahap ekspresi RNA yang digunakan secara meluas atau kaedah GRAIL membuat ramalan yang signifikan secara statistik.

Kaedah yang paling berkesan berdasarkan peringkatnya pada rangkaian interaksi fungsional protein, mengandungi sekitar 20.000 interaksi. "Algoritma terakhir adalah rasa bersalah oleh persatuan," kata Powers. Skor akhir untuk gen adalah berdasarkan skor tertinggi protein yang berinteraksi dengan produknya. "Antara muka pengesahan komputasi dan fungsional akan menjadi semakin penting untuk membolehkan analisis produktif genom kanser produktif," kata Powers.

Salah satu onkogen baru adalah POFUT1, yang bertindak dalam memberi isyarat Notch. Eksperimen susulan mengesahkan bahawa sel dengan penguat POFUT1 nampaknya lebih peka terhadap perencatan gamma-secretase pada jalur Notch.

Onkogen lain adalah FGF19, yang sangat mengejutkan kerana terletak di wilayah yang telah banyak dikaji mengenai barah. Powers menyatakan bahawa kesannya telah terlewat kerana tisu yang berlainan sangat berbeza dalam mengekspresikan gen, misalnya "pada kanser hati tetapi tidak pada barah payudara." Powers mengatakan bahawa, berbeza dengan isyarat ErbB yang lebih biasa, menaikkan FGF19 mematikan & beta-catenin tanpa mengaktifkan MAP kinase. "Pada barah hati mungkin anda hanya dapat memberikan antibodi monoklonal kepada FGF19 kepada pasien yang memiliki penguatan lokus ini."

Dalam kedua kes ini, "data yang paling menarik yang kami dapat adalah menguji kebergantungan," kata Powers. "Kami tidak benar-benar menemui sasaran baru sama seperti yang kami temui biomarker baru untuk pentadbiran rawatan."

Rangkaian barah

Genom kanser juga membolehkan para penyelidik melampaui gen individu untuk melihat rangkaian interaksi mereka. Satu hasil mendalam untuk glioblastoma multiformae, salah satu kanser pertama yang dianalisis dalam The Cancer Genome Atlas, adalah bahawa terdapat "kepelbagaian luar biasa" pada gen yang terjejas, kata Chris Sander. "Walaupun ini semua adalah glioblastoma, perbezaannya cukup besar."

Jumlah data menjadikannya tidak praktikal untuk membandingkan profil genetik tumor secara manual dengan pengetahuan latar belakang seperti laluan biologi, kata Sander. "Ini harus dilakukan secara komputasi." Analisis semacam ini menunjukkan bahawa "setiap gen individu tidak memberikan sumbangan yang konsisten di semua tumor ini, tetapi yang konsisten adalah modul, koleksi gen yang muncul bersama. Modul ini berulang pada dasarnya pada semua individu ini, tetapi pelaksanaannya berbeza dari satu individu ke individu yang lain. "

Mengatasi kepelbagaian ini memerlukan populasi pesakit barah dibahagi, sekurang-kurangnya ke dalam kumpulan utama, untuk memastikan bahawa rawatan ditujukan pada genetik khusus mereka, tegas Sander. "Saya yakin bahawa pendekatan terapi kombinatorial, yang disasarkan kepada modul tetapi diubah suai dari satu individu ke yang lain adalah cara yang tepat."

Pada barah lain, perubahan nombor salinan DNA sangat berbeza dengan perubahan pada glioblastoma, kata Sander. Tumor prostat berbeza dengan ketara dalam perubahan bilangan salinan, dan tumor metastatik mempunyai banyak lagi perubahan. Bahkan sebelum metastasis terbukti, perubahan nombor salinan adalah ramalan, kerana pesakit dengan jumlah salinan rendah mempunyai kelangsungan hidup yang lebih baik. Ujian ini "lebih ramalan daripada kelas Gleason, itulah yang akan dilaporkan oleh ahli patologi," kata Sander. "Persoalannya ialah apakah ini dapat diterjemahkan ke dalam ujian klinikal." Dia menambah bahawa "anda harus mempunyai tahap ramalan dan kepastian yang wajar untuk benar-benar dapat pergi ke sana. Secara psikologi, orang ingin dirawat."

Dari sisi konseptual, Sander mengusahakan "rasa biologi sistem" yang disebutnya "Perturbation Cell Biology." Tujuannya adalah untuk memodelkan tindak balas garis sel terhadap gangguan sistematik seperti ubat dan kombinasi ubat, seperti yang tercermin dalam pemerhatian yang kaya termasuk fenotip selular dan pengukuran molekul.

Penerangan matematik yang mendasari adalah persamaan pembezaan yang menggambarkan kepekatan molekul dalam keadaan fosforilasi yang berbeza, serupa dengan yang dibincangkan oleh Peter Sorger. Pendekatan tradisional adalah menentukan set parameter model yang optimum secara tempatan, dan kemudian mengulangi proses berkali-kali dengan keadaan permulaan yang baru. "Kemudian anda melaporkan sifat statistik agregat dari set penyelesaian ini dan lukis peta." Untuk sistem kecil, kata Sander. "Anda mendapatkan semula biologi buku teks."

"Tantangannya adalah memperluasnya ke sistem yang lebih besar," tegas Sander, karena "masalah inferensi jaringan sebenarnya tidak dapat dikendalikan dalam sistem yang lebih besar." Bekerjasama dengan Riccardo Zecchina dari Politecnico di Torino, Sander melihat idea fizik statistik yang "rasa algoritma global-ke-tempatan." Daripada membina taburan kebarangkalian dengan rata-rata mengatasi penyelesaian individu, para penyelidik terlebih dahulu memperoleh pengedaran untuk setiap nilai parameter, seperti yang menggambarkan interaksi antara dua spesies. Dalam membangun "grafik faktor" ini, interaksi lain masuk secara rata-rata, dan rangkaian disimpulkan menggunakan "penyebaran kepercayaan." Hanya dengan itu penyelidik menghasilkan penyelesaian tertentu. "Ini jauh lebih cekap," kata Sander. Tetapi ini masih dalam proses.

Penceramah:
Steven Altschuler, Pusat Perubatan Barat Daya Universiti Texas
Thomas Gingeras, Makmal Cold Spring Harbor

Sorotan

  • Sel yang berbeza dalam populasi sering berperilaku berbeza, tetapi heterogenitas ini biasanya diabaikan walaupun tidak ada sel yang berkelakuan seperti rata-rata.
  • Kepelbagaian epigenetik sel barah kultur yang luar biasa mencerminkan pelbagai populasi dari beberapa jenis, dan populasi relatif setiap jenis jatuh ke dalam corak yang meramalkan tindak balas terhadap takol ubat.
  • Dalam model maklum balas positif sederhana, heterogenitas dalam populasi sel selalu mengikuti keadaan yang memungkinkan polaritas sel berkembang.
  • Kompartemen subselular yang berbeza mengandungi transkrip RNA yang timbul dari bahagian genom yang berlainan.
  • Menjejaki transkrip mengikut petak membolehkan para penyelidik mengenal pasti transkrip yang mungkin hilang di seluruh sel, dan menunjukkan bahawa hampir separuh daripada genom ditranskripsikan dan disambungkan menjadi RNA yang matang.
  • Sambungan chimeric antara transkrip yang berasal dari kromosom yang berlainan terdapat pada tahap rendah di beberapa petak selular.

Heterogeniti sel

Ahli biologi sistem membina model rangkaian yang kompleks untuk banyak aspek biologi. Tetapi "rangkaian ini hampir keseluruhannya berasal dari pengukuran rata-rata penduduk," memberi amaran Steven Altschuler. "Dalam banyak kes, anda boleh mempunyai tindak balas yang sangat meramalkan pada populasi yang terganggu, tetapi pengukuran rata-rata anda tidak sepadan dengan satu sel dalam keseluruhan ujian anda."

"Sekiranya anda akan membuat anggapan bahawa maksudnya adalah representasi sel anda dengan baik, anda harus membuktikannya," tegas Altschuler. Dia menggambarkan tiga projek dari makmal yang dikendalikannya bersama isterinya, Lani Wu, di mana heterogenitas bukan sekadar kebisingan, tetapi secara biologinya penting. "Sel yang berbeza dari rata-rata boleh menjadi sangat penting."

Contoh pertama berkaitan pengembangan adiposit, atau sel lemak. Litar molekul terkenal yang mendasari proses ini termasuk pengatur utama PPAR & gamma yang mendorong pertumbuhan titisan lipid yang stabil di dalam sel serta tahap adiponektin. Harapan semula jadi adalah bahawa sel-sel individu akan mengikuti lintasan yang sama, dengan pertumbuhan titisan dan tahap adiponektin yang berkorelasi.

"Jika anda melihat sel-sel, ia agak mengganggu," kata Altschuler, kerana kebanyakan sel mempunyai tetesan lipid besar atau tahap adiponektin yang tinggi, tetapi tidak pernah keduanya. Menjejaki sel individu menunjukkan bahawa dalam "hampir semua" sel tersebut, tahap adiponektin meningkat terlebih dahulu, dengan titisan lipid kecil. Kemudian, tetesan tumbuh, disertai dengan penurunan tahap adiponektin, yang bertentangan dengan yang diharapkan dari pengukuran purata populasi.

"Korelasi adalah ilusi," Altschuler menyimpulkan, kerana sejumlah besar sel yang masih menjalani pembezaan awal membantah rata-rata. Lebih-lebih lagi, sebatian tambahan hampir selalu mempengaruhi subpopulasi yang berbeza secara berbeza, daripada hanya memindahkannya semua dengan cara yang sama. Akibatnya, Altschuler mengatakan, dengan mengkaji kesan pada subpopulasi, "kita sebenarnya mempunyai cara untuk mengenal pasti sasaran baru sebatian."

Pada bahagian kedua ceramahnya, Altschuler menghidap barah. "Hampir selalu, heterogenitas diabaikan, kerana anda tidak tahu apa yang harus dilakukan dengannya," katanya. Pasukannya membandingkan sekumpulan 49 klon dari barisan sel barah paru-paru. "Saya menganggap bahawa banyak perbezaan yang kita lihat adalah epigenetik," kata Altschuler.

Menggunakan penanda untuk memberi isyarat, "anda melihat kepelbagaian yang hebat," kata Altschuler. "Anda berfikir bahawa barah pasti sangat rumit." Tetapi algoritma pengekstrakan ciri menjadikan klasifikasi dapat dikendalikan, dan analisis komponen utama mengurangkan 1000 ciri menjadi sekitar 20 eigendimensi per sel. Selain itu, semua variasi antara sel dapat ditangkap menggunakan sekitar lima subpopulasi, kata Altschuler. "Ini tidak lagi terasa seperti masalah kerumitan yang tidak terhingga."

Dalam menganalisis 49 klon, Altschuler berkata, "perkara paling menakjubkan terjadi: mereka mengelompokkan ke dalam enam atau tujuh kluster yang berbeza," masing-masing dengan pecahan khas sel dalam subpopulasi yang berbeza. Lebih-lebih lagi, klasifikasi ini memisahkan klon dengan sempurna sehubungan dengan tindak balas mereka terhadap taksol ubat. "Subpopulasi ensemble memungkinkan kita, sebelum kita memberi ubat ini kepada populasi ini, kemampuan untuk membezakan sama ada mereka sensitif terhadap dadah atau tidak," Altschuler menyimpulkan.

Topik ketiga Altschuler meneroka bagaimana heterogenitas muncul dalam model teori polarisasi sel. Model ini merangkumi zarah aktif pada membran sel yang dapat merekrut zarah tidak aktif dari sitosol dan menjadikannya aktif. "Ini adalah gelung maklum balas positif klasik anda." Altschuler berkata. Di samping itu, zarah-zarah dalam membran meresap di sekitar permukaan sel.

Ternyata ada satu parameter utama dalam model: bilangan zarah per sel. Sekiranya bilangan ini besar, zarah meresap di mana-mana dan tidak timbul polarisasi.(Ini berbeza dengan kes klasik yang dikaji oleh Turing dan lain-lain, di mana pembentukan corak mencerminkan maklum balas positif dan negatif.) Sekiranya bilangan zarah kecil, maklum balas terlalu kecil untuk polaritas timbul. Hanya untuk bilangan zarah perantaraan model ini menghasilkan kekutuban sel. Tetapi untuk nilai parameter yang mana polarisasi berlaku, ia hanya berlaku untuk kira-kira separuh sel. "Heterogenitas secara matematik tidak dapat dielakkan di sini," kata Altschuler.

Penyetempatan subselular RNA ditranskrip

Ekspresi heterogen, walaupun dalam sel, juga penting untuk RNA. Salah satu cara untuk mengira berapa banyak genom berfungsi adalah dengan mengukur berapa banyak gen itu ditranskripsikan ke dalam RNA dan diproses menjadi bentuk yang boleh digunakan. Pasukan besar GENCODE dari projek ENCODE sedang mengkaji urutan cDNA yang diterbitkan dengan panjang penuh dan menguruskannya untuk memastikan "kualiti, kapasiti pengekodan, nampaknya kesahihan laman penyambungan, dan sebagainya," kata Thomas Gingeras. Kira-kira 142,000 transkrip telah dijelaskan dengan baik, katanya, separuh daripadanya nampaknya bukan pengekodan protein. "Kira-kira 70% transkrip tidak dijelaskan," kata Gingeras, jadi banyak yang harus dipelajari.

Aspek penting dari projek ini adalah mengesan, dalam 15 baris sel, transkrip yang muncul di petak subselular yang berbeza, termasuk sitoplasma dan nukleus, dan untuk satu garis sel di nukleolus, nukleoplasma, dan kromatin. Menyedari komposisi heterogen dari petak ini menunjukkan kemungkinan fungsi yang berbeza untuk transkrip.

Melihat petak yang berbeza juga menyoroti kepentingan transkrip yang jarang berlaku. "Pengayaan ini memungkinkan anda untuk melihat lebih sedikit perkara yang seharusnya berada di belakang pengedaran," kata Gingeras. Sebaliknya, "jika anda memperlakukan seluruh sel sebagai beg molekul, lebih baik anda mengeluarkannya."

Para penyelidik memperoleh kira-kira 400 juta bacaan urutan di setiap petak. "Itu nampaknya banyak, tetapi hanya memungkinkan kita melihat sekilas transkrip bilangan rendah yang terdapat di ruangan tertentu," kata Gingeras. Tetapi dia menekankan bahawa sebagian besar pembacaan melewati "tingkat penemuan yang tidak dapat direduksi" atau IDR, kemungkinan pengukuran berulang tidak akan mengukur hasil yang sama. "Data ini yang kami gunakan sangat konservatif." Walaupun dengan nilai IDR 0,1, dia berkata, "genom hampir separuh ditutup dengan transkrip yang diproses dan disambungkan."

Dari sekian banyak kelas transkrip yang menarik, "satu kelas menonjol," kata Gingeras. Transkripsi helai ini nampaknya bermula di wilayah 3 & perdana yang tidak diterjemahkan (UTR) di hujung transkrip lain. Transkrip semacam itu berlaku pada 80% gen yang dinyatakan dalam lalat dan 62% gen manusia yang dinyatakan diperiksa setakat ini. "Ini seperti jenis wilayah yang diatur untuk ekspresi," kata Gingeras.

Urutan yang ditranskrip dalam petak yang berbeza berasal dari kawasan yang sangat berbeza. Contohnya, "dalam inti dan kromatin, hujung 5 & ujung utama paling banyak dijumpai berasal dari kawasan intergenik, bukan dari transkrip yang diberi penjelasan." Gingeras diperhatikan. "Sel memasukkan transkrip kompartemen ini yang dimulai di berbagai bahagian genom."

Populasi RNA yang ditranskripsikan berbeza jauh, bergantung pada petak selular tempat mereka diasingkan.

Gingeras juga menggambarkan RNA "chimeric", yang menggabungkan segmen yang ditranskripsikan dari kromosom yang berbeza. Kombinasi ganjil ini telah dijelaskan oleh orang lain dalam kesusasteraan, tetapi fungsi mereka dan bahkan keberadaannya menjadi kontroversi. Setelah pemeriksaan silang eksperimen yang luas, Gingeras berkata, "jelas molekul-molekul ini ada di dalam sel-sel di mana kita telah mengenal pasti mereka, walaupun jumlah salinannya jauh lebih rendah dalam jenis sel itu daripada bentuk-bentuk sambatan biasa."

Antara lain, para penyelidik mendapati bahawa chimera cenderung bergabung dengan kawasan yang berdekatan dalam kromatin tiga dimensi. "Tujuh puluh enam peratus RNA chimerik yang kita lihat jatuh di kawasan di mana DNA, dengan percubaan pautan silang, cukup dekat untuk dihubungkan silang dalam eksperimen 5C. Sepertinya wilayah genomik digabungkan untuk tujuan transkrip. "

"Kami tidak menganggap ini adalah peristiwa rawak, walaupun jumlahnya cukup rendah," kata Gingeras. Secara keseluruhan, "landskap transkripsi mengandungi pelbagai transkrip yang fungsinya masih belum ditentukan, tetapi ciri-ciri yang tidak kita ketahui."

Penceramah:
Stuart Schreiber, Institut Luas
Marc Vidal, Institut Kanser Dana-Farber dan Sekolah Perubatan Harvard

Sorotan

  • Tindak balas terhadap molekul-molekul kecil dapat berfungsi sebagai pengklasifikasi untuk kehadiran atau subjenis barah.
  • Para penyelidik secara sistematik mengkatalogkan tindak balas molekul sel ke pelbagai tahap molekul kecil yang sangat spesifik, untuk membantu menghasilkan hipotesis untuk biologi penyakit dan rawatan.
  • Mempelajari rangkaian, contohnya interaksi protein & ndashprotein, telah memberikan pandangan penting antara genotip dan fenotip seperti penyakit.
  • Kira-kira separuh daripada mutasi yang menyebabkan penyakit manusia nampaknya "edgetic": mengubah interaksi antara protein dan bukannya kehadirannya.
  • Mencari protein yang disasarkan oleh virus dan gen yang menyebabkan penyakit yang sama mengenal pasti calon baru untuk campur tangan.
  • Rangkaian interaksi nampaknya berkembang lebih cepat daripada urutan pengekodan protein.

Probe molekul kecil kanser

Pengetahuan luas mengenai rangkaian molekul yang mendasari penyakit tidak banyak digunakan untuk pesakit tanpa cara untuk memanipulasi rangkaian tersebut, misalnya menggunakan ubat molekul kecil. Pada masa yang sama, tindak balas terhadap molekul kecil yang mengganggu nod tertentu dalam rangkaian dapat menghasilkan pandangan biologi yang kuat tentang bagaimana simpul itu berinteraksi dengan orang lain. Untuk mempercepat terapi dan pemahaman asas, Stuart Schreiber dan rakan-rakannya mengumpulkan katalog komprehensif tindak balas bergantung kultur kultur sel ke perpustakaan sebatian yang disasarkan secara sempit. "Kami berusaha untuk melihat terapi barah secara bersepadu," katanya, melengkapkan katalog respons sebelumnya dengan ciri genetik sel yang terperinci.

Beberapa molekul kecil sangat berkesan terhadap jenis genetik barah tertentu. Imatinib, yang dipasarkan di A.S. sebagai Gleevec, pada dasarnya 100% berkesan terhadap leukemia myelogenous kronik, misalnya. Tetapi "kurang dari 1% pesakit barah hari ini mendapat manfaat daripada hasil klinikal yang dramatik ini," kata Schreiber, kerana tidak ada ubat yang serupa dengan kanser mereka. Projek barunya bertujuan untuk mendapatkan faedah yang lebih luas dengan menghubungkan populasi pesakit yang berbeza secara genetik dengan sasaran ubat atau kombinasi ubat.

Pasukan Schreiber baru-baru ini menunjukkan bahawa tindak balas sel kultur terhadap pelbagai molekul kecil dapat mengenal pasti pesakit dengan bentuk genetik diabetes yang disebut MODY1. "Anda boleh menggunakan molekul kecil sebagai pengkelasan dan meramalkan sama ada sel-sel itu berasal dari individu yang terkena atau tidak terjejas," katanya. Karya ini merupakan salah satu inspirasi untuk projek mereka, yang dibiayai oleh Network Target Discovery and Development Network NCI, atau CTD 2, untuk menterjemahkan data genom barah (dibincangkan oleh Scott Powers dan Chris Sanderke dalam aplikasi klinikal.

"Apa yang kita tidak tahu adalah sama ada molekul kecil yang menargetkan ketergantungan bukan onkogen, menggunakan prinsip kematian sintetik, boleh mempunyai hasil klinikal yang sama," Schreiber memberi amaran. Ketergantungan seperti itu biasa terjadi pada barah, kerana, kerana onkogen memilih jalur isyarat yang ada untuk percambahan dan kelangsungan hidup barah, mereka memerlukan sokongan protein lain untuk memungkinkan laluan ini.

Sebagai contoh, onkogen adalah protein labil yang sensitif terhadap suhu, jadi mereka memerlukan keperluan untuk pendamping. Penjelajahan awal data yang terkumpul menunjukkan bahawa kesan penghambat pendamping seperti itu, protein kejutan panas HSP70, meningkat dalam sel dengan Myc yang diperkuat, yang sering dijumpai pada kanser.

Molekul kecil lain mempunyai kesan yang jauh lebih besar pada sel dengan mengaktifkan mutasi pada onkogen & beta-catenin. Schreiber mencadangkan bahawa kesan ini tidak berkaitan dengan & beta-catenin peranan dalam isyarat Wnt (dibincangkan oleh Randall Moontetapi kesan molekul kecil dalam meneutralkan spesies oksigen reaktif, yang berkaitan dengan metabolisme sel kanser yang tidak biasa.

Kes-kes ujian awal ini, dan lain-lain, menyokong usaha Schreiber dan pasukannya untuk secara sistematik mengaitkan hubungan tindak balas dos sel-sel dengan pelbagai sebatian. Sebatian ini, yang membentuk kit penyiasat CTD 2, dipilih "terutamanya berdasarkan bukti bahawa sebatian tersebut sangat selektif," kata Schreiber. "Kami memanggil mereka 'sebatian aktif yang sempit'." Dengan menggunakan automasi yang luas, para penyelidik mencirikan tindak balas molekul dan fenotipik 1000 sel yang dicirikan secara genetik terhadap pelbagai kepekatan molekul kecil. Sebagai tambahan kepada respons individu, Schreiber menekankan, "anda boleh menggunakan sel-sel genetik ini untuk melihat kombinasi sebatian."

Projek lain yang sedang diusahakan oleh Schreiber dan rakan-rakannya disebut sebagai Cancer Cell Line Encyclopedia Project, sebuah kolaborasi dengan Institut Penyelidikan Bioperubatan Novartis. Sumber ini tidak lama lagi akan menyediakan data pencirian yang luas untuk banyak rangkaian sel yang tersedia untuk umum, termasuk data bilangan salinan genom, ekspresi gen, dan mutasi onkogen sasaran, serta penjujukan exome yang luas. Schreiber berharap sumber-sumber ini dapat mengubah siri farmasi "baldi-brigade" tradisional secara dramatik.

Menghubungkan genotip dan fenotip melalui rangkaian interaksi

Data genotip untuk individu yang sihat dan tumor tersedia secara meluas. Hubungan antara genotip dan fenotip ini, seperti kerentanan terhadap penyakit "adalah soalan paling menarik dalam biologi," kata Marc Vidal. Tetapi hubungannya kompleks. Bahkan sifat Mendel yang sederhana menunjukkan penembusan yang tidak lengkap, pelbagai kesan mutasi, dan pengubahsuaian oleh gen lain. Untuk sifat kompleks, hubungannya lebih kurang langsung. "Untuk memahami hubungan genotip-fenotip, yang jauh dari linear, kita perlu memahami sistem," kata Vidal.

Salah satu cara yang paling berkesan untuk menerangkan hubungan nonlinier ini adalah dengan bahasa rangkaian, dengan spesies makromolekul diwakili sebagai nod dan interaksinya sebagai tepi. Berdasarkan kemajuan sedekad, Vidal berkata, "kita dapat dengan selamat mengatakan bahawa terdapat sifat global yang benar-benar ada dalam rangkaian interaksome selular, DAN bahawa sifat-sifat itu berkaitan dengan biologi."

Vidal adalah pelopor dalam pengukuran lengkap interaksi protein & ndashprotein, khususnya melalui kaedah ragi dua-hibrid. Setakat ini, hanya kira-kira 20% interaksiome ragi dan sekitar 5% interaksiomeum manusia diketahui. Tetapi Vidal berpendapat dalam 10 tahun lagi sekitar 70% & ndash90% dari rangkaian tersebut akan dipetakan dengan kualiti yang tinggi, dan akan terus menghasilkan pandangan biologi.

Dalam konteks penyakit manusia, Vidal menyatakan bahawa "dalam banyak kes, anda mempunyai mutasi pada beberapa gen yang dapat menyebabkan satu gangguan, dan sebaliknya, iaitu mutasi yang berbeza pada gen yang sama dapat menimbulkan gangguan yang berbeza." Untuk meneroka hubungan ini, dia dan kolaboratornya menambang pangkalan data Mendelian Inheritance in Man (OMIM) dalam talian untuk membina "penyakit." Dengan menghubungkan penyakit yang berkongsi gen dan gen yang mempunyai penyakit, mereka membuat graf bipartit yang membantu menggambarkan hubungan kompleks antara penyakit.

Melihat hubungan antara penyakit ini membawa kepada persoalan baru, kata Vidal, seperti "Bagaimana kita menjelaskan bahawa mutasi yang berbeza dalam gen yang sama menimbulkan gangguan yang berbeza, dari perspektif rangkaian?" Dia mencadangkan bahawa beberapa penyakit timbul bukan kerana simpul tertentu, yang mewakili makromolekul, hilang dari grafik. Sebaliknya, kelebihan jaringan, atau interaksi, dapat diubah. "Gangguan kelebihan lain mungkin memberikan fenotip yang berbeza," katanya.

Kira-kira separuh daripada mutasi yang berkaitan dengan penyakit manusia nampaknya mengganggu interaksi antara protein, atau tepi, daripada mematikan protein itu sendiri.

Vidal dan rakan-rakannya menggunakan data urutan dari Pangkalan Data Mutasi Gen Manusia untuk menguji kemungkinan ini, dengan hipotesis bahawa perubahan urutan seperti kodon berhenti pramatang mungkin mewakili gangguan nod, sementara mutasi missense atau dalam-bingkai cenderung "edgetic," yang mempengaruhi interaksi protein. Mereka mendapati bahawa kira-kira separuh daripada mutasi yang diketahui berkaitan dengan penyakit kelihatan edgetik.

Dalam ujian lanjutan, Vidal mengatakan, "setiap kali, kami mengatakan, menurut model sederhana ini, gen ini sebenarnya dapat menimbulkan gangguan edgetik, kami dapat mengesahkan secara eksperimental bahawa ini memang benar." Melihat protein yang mempunyai banyak domain pengikat dan gennya terhubung dengan sekurang-kurangnya dua penyakit, katanya, menunjukkan bahawa gangguan yang berlainan selalu mencerminkan mutasi pada domain yang berbeda, seperti yang diharapkan.

Idea untuk mengubah kelebihan dalam rangkaian juga memberikan jendela baru mengenai evolusi, kata Vidal. Pasukannya meneroka bagaimana perubahan rangkaian berubah semasa evolusi, dan bukan urutan gen itu sendiri. Mereka mengeksploitasi data empirikal dari tumbuhan, yang mempunyai banyak pasangan paralogous yang mirip dan mungkin muncul dari pendua pada nenek moyang yang sama. Analisis setakat ini menunjukkan bahawa profil interaksi untuk gen pendua berbeza lebih cepat daripada urutan yang sepadan.

Dalam projek lain yang sedang dijalankan, Vidal dan pasukannya sedang melihat virus penyebab penyakit, dan membandingkannya dengan mutasi genetik yang menyebabkan penyakit yang sama. Mereka telah mengesahkan bahawa sasaran protein virus berada dalam rangkaian interaksi dengan produk gen yang terlibat dalam penyakit yang sama. "Jalan terpendek membantu kita untuk membuat hipotesis untuk etiologi penyakit," kata Vidal.

Penceramah:
Charlie Boone, Universiti Toronto
Leonid Kruglyak, Universiti Princeton

Sorotan

  • Interaksi bukan aditif, seperti kematian sintetik, antara pasangan gen yang dihapuskan sangat bermaklumat mengenai hubungan gen, dan dikategorikan secara sistematik dalam ragi.
  • Gen dengan corak interaksi yang serupa dengan orang lain sering kali berada di jalur yang sama, dan menyiratkan rangkaian dengan fungsi biologi yang dapat dikenali.
  • Sebagai perbandingan dengan mutan berganda, variasi semula jadi sepenuhnya yang ditunjukkan oleh persilangan antara strain genetik yang jauh lebih kompleks.
  • Keturunan penyakit manusia tidak sepenuhnya dijelaskan oleh kesan kecil dari varian individu yang telah dikenal pasti oleh kajian seluruh genom.
  • Salib ragi menghasilkan berjuta-juta jenis genetik yang berbeza, yang memungkinkan penilaian kuantitatif mengenai sumbangan lokasi genetik yang berbeza terhadap sifat.

Meneliti mutan berganda ragi

Penghapusan sistematik pasangan gen dalam ragi memberikan banyak maklumat mengenai bagaimana gen berinteraksi antara satu sama lain, kata Charlie Boone. Rangkaian berdasarkan interaksi genetik ini mengumpulkan semula biologi yang diketahui dan mendedahkan aspek baru dari jalan dan kompleks. Tetapi persilangan antara regangan menunjukkan bahawa kesan variasi semula jadi tidak mudah dijelaskan dari segi pasangan yang berinteraksi.

Dari 6000 gen dalam ragi, kata Boone, 5000 dapat dihapuskan tanpa membunuh organisma. Untuk selebihnya 1000 gen "penting", para penyelidik sedang mengembangkan alel sensitif suhu (ts) yang menghapusnya dengan berkesan selepas pengembangan. Secara keseluruhan, ini bermaksud bahawa penyelidik dapat membuat kira-kira 18 juta mutan penghapusan ganda yang berbeza, yang masing-masing bertujuan untuk dicirikan oleh Boone.

"Interaksi genetik berlaku apabila sesuatu yang pelik berlaku," kata Boone. Contoh yang paling jelas adalah kepincangan sintetik, apabila kedua-dua gen itu tidak penting tetapi menghapuskan keduanya boleh membawa maut. Ini boleh berlaku apabila dua gen terletak di jalur berlebihan, dan sel memerlukan sekurang-kurangnya satu jalur untuk bertahan. "Banyak jalan tidak penting. Kerana ada jalan sandaran," kata Boone. Interaksi sebaliknya berlaku apabila kedua-dua gen menyebabkan penurunan kecergasan, tetapi kerana keduanya mengganggu jalan yang sama, menghapus kedua-duanya tidak memburukkan lagi keadaan.

"Gen dengan corak interaksi mematikan sintetik yang sama sering berada di jalan yang sama," kata Boone. Menghubungkan gen yang mempunyai corak interaksi yang serupa mewujudkan rangkaian interaksi genetik yang serupa dengan interaksi protein fizikal atau persamaan dalam ekspresi gen. "Pada akhirnya, kedudukan gen pada rangkaian dan kesambungannya menentukan fungsinya," kata Boone.

Pengelompokan gen berdasarkan kesamaan interaksi mereka membawa kepada rangkaian di mana gen dengan fungsi biologi yang biasa dikelompokkan bersama, bersama dengan beberapa gen yang sebelumnya tidak diketahui. "Tidak dapat tidak, ketika kami mengujinya, gen ini adalah komponen baru dari jalan yang mereka hubungkan."

Boone, Brenda Andrews, dan kolaborator mereka berharap dapat memperluas ukuran ini untuk merangkumi semua kemungkinan pasangan dalam beberapa tahun. "Salah satu cabaran utama dengan projek-projek ini adalah menyelesaikannya," katanya. Selain mengotomatisasi penyediaan dan pengukuran ukuran koloni sebagai petunjuk kecergasan, satu cabaran besar adalah mengembangkan ukuran kuantitatif penyimpangan mutan berganda dari kesan yang diharapkan dari menggabungkan penghapusan individu. Penyimpangan ini boleh menjadi "negatif" seperti sandaran, atau "positif" ketika gen bekerja sama.

Rangkaian interaksi genetik disimpulkan semata-mata dari hasil mutasi berganda yang tidak dijangka sering menghubungkan gen fungsi biologi yang berkaitan.

Membandingkan rangkaian interaksi genetik dengan interaksi protein & ndashprotein yang diketahui menghasilkan beberapa kejutan. Sebagai contoh, protein yang berinteraksi secara fizikal dalam kompleks diharapkan dapat menunjukkan interaksi genetik yang positif, sehingga pasangan ini kurang merugikan daripada kesan gabungan yang diharapkan, kerana kompleks tersebut sudah dilumpuhkan. Tetapi walaupun "ada interaksi positif yang bertindih dengan interaksi fizikal, hanya ada banyak interaksi negatif yang bertindih dengan interaksi fizikal," kata Boone. Di samping itu, "banyak interaksi positif juga berlaku di antara laluan."

Pada akhirnya, penyelidik ingin memahami bagaimana varian gen yang berbeza berinteraksi dalam persekitaran semula jadi yang kompleks, bukan hanya pada pasangan terpencil. Untuk mengetahui tentang kebolehubahan semula jadi ini, Boone dan rakannya mengkaji persilangan antara dua strain makmal yang mempunyai ciri baik.

Pasukan ini mencari gen "bersyarat penting", yang penting dalam satu strain tetapi tidak pada gen yang lain. Mereka kemudian melakukan persilangan antara strain di mana gen itu penting tetapi hadir dengan yang lain di mana ia tidak penting dan dihapuskan. Mereka menjangkakan bahawa kelangsungan hidup hibrida sering bergantung pada kehadiran alel gen yang berbeza yang menjadikan gen yang dihapus itu membawa maut.Melihat statistik salib, "kita dapat menilai sama ada keperluan bersyarat ini disebabkan oleh kes kematian sintetik yang sederhana atau tidak," kata Boone. Tetapi "ini bukanlah satu-satunya kes pengubah tunggal yang membawa kepada interaksi mematikan sintetik," dia terkejut. "Kesimpulan kami adalah bahawa genotip ke fenotip adalah masalah yang sangat kompleks."

Mengira sumbangan genetik kepada sifat

Walaupun beberapa sifat dan penyakit manusia mengikuti warisan Mendel yang sederhana, kata Leonid Kruglyak, "sebahagian besar perkara yang sangat kita sayangi. ikuti corak warisan yang jauh lebih rumit." Walaupun kajian perkaitan luas genom dalam beberapa tahun terakhir telah menghasilkan hampir 1000 kawasan genetik yang berkaitan dengan penyakit, kesan keseluruhan gen ini biasanya tidak menjelaskan keturunan yang diketahui.

Tinggi manusia, misalnya, 80% boleh diwariskan, tetapi 180 lokasi yang diketahui menjelaskan hanya 10% varians penduduk. Salah satu sumber "heritabilitas yang hilang" adalah bahawa terdapat banyak varian dengan ukuran kesan yang lebih besar, tetapi ini jarang dilihat secara meyakinkan dalam kebanyakan kajian.

"Kerana kita menghadapi kesan kecil, kita memerlukan ukuran sampel yang sangat besar," kata Kruglyak. Walaupun mencirikan 100,000 manusia adalah cabaran utama, "tidak ada masalah untuk menumbuhkan populasi besar dalam ragi." Pasukannya memilih sebilangan ciri, kepekaan terhadap ubat yang berbeza, yang terus berubah dalam ragi dengan cara yang genetik kompleks. Mereka kemudian bertanya apakah mereka dapat menemui semua gen yang terlibat dalam variasi sifat ini. "Mengemukakan soalan dengan cara ini hampir meyakinkan kita akan kegagalan," kata Kruglyak, "tetapi kami ingin mencapai sejauh yang kami mampu."

Seperti dalam eksperimen Boone, menyeberangi dua jenis yang berbeza menghasilkan variasi yang luas, dalam hal ini kepekaan terhadap ubat. Daripada fenotip keturunan individu, para penyelidik memutuskan untuk memanfaatkan bilangan yang banyak dan fenotip populasi & mdash tetapi hanya yang keluar. "Sebilangan besar maklumat genetik terdapat pada individu yang ekstrem secara fenotip," kata Kruglyak.

Populasi yang dihasilkan, mengandungi ribuan atau puluhan ribu jenis genetik yang berbeza, masih terlalu besar untuk genotip secara individu. Oleh itu, "bukannya membuat genotip satu per satu, kita hanya mengukur frekuensi kedua alel ibu bapa melintasi genom." Untuk alel yang mendorong sifat ke arah nilai yang melampau, frekuensi yang diharapkan harus menyimpang dari nisbah 50/50 untuk seluruh penduduk.

"Caranya adalah dengan melakukan ini secara kuantitatif," kata Kruglyak. Tetapi dengan berhati-hati, "kita dapat mengesan lokus walaupun mereka mempunyai kesan fenotipik yang cukup kecil." Salah satu muslihat penting untuk meningkatkan nisbah isyarat-ke-bising adalah menggunakan microarrays khusus dengan probe untuk alel dari setiap regangan, dan bukan hanya menyimpulkan alel dari kehadiran atau ketiadaan isyarat.

Kruglyak sebelumnya telah mengkaji kepekaan terhadap 4-nitroquinoline 1-oxide, atau 4NQO, menghubungkan kepekaan terhadap agen yang merosakkan DNA ini dengan gen tertentu yang disebut RAD5 yang bertindak dalam pembaikan kerosakan DNA. "Ini menjelaskan beberapa variasi tetapi tidak menjelaskan semuanya," dia ingat.

Dari salib, pasukannya memilih segregan tersebut dengan ketahanan yang melampau terhadap 4NQO, dan secara genotip menaip subpopulasi ini. "Sebagai tambahan kepada RAD5, yang muncul sebagai pilihan kami yang paling jelas dan terkuat sebagaimana mestinya, terdapat sekitar selusin sumbangan lokus lain dari kedua jenis induk itu, "kata Kruglyak.

Pendekatan gabungan ini mengenal pasti lokasi penting, tetapi tidak tepat mengenai ukuran kesannya atau sama ada dan bagaimana mereka berinteraksi, kata Kruglyak. "Anda boleh mendapatkannya dengan membuat koleksi segregan individu, mengukur fenotip mereka, dan hanya membuat genotip pada kedudukan di mana anda menemui lokasinya. Oleh itu, anda tidak perlu membayar kos eksperimen atau statistik untuk mencari keseluruhan genom. "

Analisis ini menunjukkan bahawa lokus lain mempunyai kesan yang jauh lebih kecil daripada RAD5, yang menjelaskan sekitar 40% varians. Kesan dari lokus lain semuanya di bawah kira-kira 5%, yang tidak akan signifikan secara statistik dalam imbasan hubungan genom tradisional.

Para penyelidik terus menguji kepekaan terhadap "kira-kira 20 sebatian kimia lain dan cara lain untuk membuat sel ragi tidak bahagia," kata Kruglyak. "Senibina genetik boleh kelihatan sangat berbeza." Untuk beberapa penghinaan, kepekaan didominasi oleh satu lokus dengan corak warisan Mendel. Dalam kes lain, terdapat sebanyak 20 lokasi yang signifikan secara statistik yang menyumbang kepada variasi.

Teknik ini tidak terhad kepada pengayaan untuk ketahanan terhadap ubat. Satu peluasan yang kuat adalah menggunakan penyortiran sel untuk mengasingkan individu dengan fenotip yang melampau. Teknik ini kemudian dapat digunakan untuk harta benda yang ada wartawan yang sesuai. Kruglyak menggambarkan penyortiran berdasarkan output mitokondria, tetapi dapat diterapkan untuk mengesan lokasi genetik untuk banyak jenis variasi fenotipik.

Penceramah:
Michael Snyder, Universiti Stanford
John Stamatoyannopoulos, Universiti Washington

Sorotan

  • Perbezaan peraturan kerana pengikatan variabel faktor transkripsi mendasari banyak variasi individu dan juga penyakit.
  • Faktor transkripsi khusus yang mengatur hanya beberapa gen boleh menjadi sama pentingnya, untuk gen tersebut, sebagai pengatur utama yang mempunyai kesan meluas.
  • Penjujukan genom yang diperibadikan memerlukan ketepatan yang lebih baik, khususnya dalam menilai jumlah salinan gen, dan tafsirannya sering tidak pasti.
  • Pemetaan pembelahan oleh DNase I memberikan petunjuk langsung, seluruh genom lokasi yang dapat diakses oleh ciri pengawalan DNA seperti pembentukan nukleosom dan pengikatan faktor transkripsi.
  • Corak tapak hipersensitif DNase I dalam sel yang berbeza mencerminkan hubungan perkembangan sel.
  • Urutan mendalam dari laman pembelahan menunjukkan corak pemisahan ciri, pada resolusi nukleotida tunggal, untuk faktor transkripsi yang berbeza.

Variasi pengikatan faktor transkripsi

Sebagai pakar dalam teknik genomik, Michael Snyder memutuskan untuk melihat pilihan yang semakin berpatutan untuk analisis genom peribadi. Dia membandingkan hasil dari Genomik Lengkap dan Illumina, yang keduanya mengenal pasti lebih daripada 3 juta polimorfisme nukleotida tunggal (SNP). Masing-masing mempunyai beberapa ratus ribu panggilan yang tidak ada di set lain, perbezaan yang disebabkan oleh Snyder kerana kehilangan data. "Masalah nombor satu dengan membuat urutan genom anda adalah bahawa mereka tidak cukup mendalam di semua wilayah."

Malah SNP yang dilaporkan oleh kedua-dua syarikat tidak setuju dalam banyak kes mengenai zygosity, yang "membuat perbezaan besar. Bukan masalah besar untuk 1000 genom dengan liputan rendah," kata Snyder. Tetapi "Saya tidak peduli rata-rata. Saya mengambil berat tentang saya." Secara keseluruhan katanya, masih ada jalan panjang dari segi ketepatan dan tafsiran data genom peribadi. Tekniknya kurang dipercayai untuk varian struktur, seperti penyisipan, penghapusan, dan penyongsangan, kata Snyder.

Dalam penyelidikan utama mereka, Snyder dan pasukannya meneroka variasi antara spesies yang berkaitan dan antara individu. Khususnya, mereka ingin melihat seberapa besar kebolehubahan yang timbul daripada perbezaan pengikatan faktor transkripsi.

Dalam satu kajian, mereka memetakan pengikatan sel seluruh genom, menggunakan imunoprecipitasi dan urutan kromatin (ChIP-seq), faktor transkripsi Ste12 dalam ragi. Mereka mengeksploitasi variasi semula jadi antara 45 strain segregan dari persilangan antara dua strain makmal dan mengesan pengikatan, serta ekspresi gen, setelah mendedahkan ragi ke feromon.

Sebilangan besar laman web (kira-kira 70%) menunjukkan pengasingan Mendel klasik, mengikat Ste12 dalam satu latar belakang genetik dan bukan di tempat lain. Tetapi laman web lain menunjukkan "pelanggaran" dari jangkaan ini, misalnya mengikat di beberapa segregan ketika kedua-dua ibu bapa tidak melakukannya.

Pasukan Snyder kemudian mencari lokasi sifat kuantitatif (QTL) yang menyumbang kepada pengikatan di laman web yang sangat berubah-ubah ini. Dari 195 laman web dengan QTL unik, 166 adalah cis (dekat dengan kawasan pengikat), sementara 35 adalah trans (sebilangan kecil keduanya). "Sebilangan besar laman web pengikat berubah-ubah dihubungkan di cis kepada QTL, "kata Snyder.

Penjelasan paling mudah adalah bahawa perbezaan dalam mengikat mencerminkan perubahan dalam urutan laman pengikat untuk Ste12. "Ternyata itu benar, tetapi hanya berlaku pada 36 dari 166 cis-rantau yang berubah-ubah, "kata Snyder. Selebihnya, nampaknya terdapat variasi dalam urutan yang kod kofaktor yang membantu Ste12 untuk mengikat. Menggunakan ujian untuk apa yang mereka sebut" Allele Binding Cooperativity, "atau ABC, pasukan menemui enam yang baru laman pengikat untuk faktor-faktor yang motifnya bersesuaian dengan pengikatan Ste12.

"Tidak ada faktor ini yang diketahui sebelumnya bekerja dengan Ste12," kata Snyder, yang merupakan pengatur utama yang mengikat sekitar 1000 laman web di seluruh genom. "Orang-orang ini hanya beroperasi pada subkumpulan wilayah, tetapi mereka mempunyai kesan yang sangat kuat" di tempat-tempat yang mereka ikuti. "Kami fikir pengikatan koperasi seperti ini berleluasa di seluruh genom," kata Snyder. Tetapi kerana kesannya hanya berlaku di beberapa laman web, sukar untuk dikesan dalam imbasan luas genom, katanya. "Inilah yang akan membuat kod peraturan sangat sukar untuk diuraikan."

Dalam pekerjaan yang berkaitan dengan manusia, Snyder dan rakannya memetakan dua faktor, RNA polimerase II (Pol-II) dan NF & kappaB. Mereka membandingkan data ChIP-seq untuk sel dari sepuluh individu, mencari variasi pada 7.5% laman web untuk NF & kappaB dan 25% untuk Pol-II. "Ada sejumlah wilayah pengikatan berubah di luar sana," kata Snyder, dan rata-rata pengikatan tersebut berkorelasi dengan ekspresi gen.

Hanya sekitar 7% variasi pengikatan sesuai dengan penyimpangan dari motif pengikatan konsensus. Terdapat juga beberapa laman web yang mengikatnya berkorelasi dengan varian nombor salinan, dan juga dengan pembalikan (bersama-sama sekitar 3%). 31% laman web lain mempunyai SNP berdekatan, tetapi untuk dua pertiga laman web, "kami tidak tahu apa yang berlaku," kata Snyder.

Dengan menggunakan ujian ABC mereka, Snyder berkata, "kami menemui lima faktor berbeza yang motifnya berbeza-beza sesuai dengan pengikatan NF & kappaB mereka," tetapi tidak di laman pengikat NF & kappaB. Hasilnya menunjukkan bahawa, seperti dalam ragi, beberapa laman web dikendalikan bukan hanya oleh pengatur utama tetapi juga oleh faktor-faktor lain yang sangat kuat. "Ini adalah cara yang baik untuk melihat faktor mana yang bekerjasama."

Pemetaan protein seluruh DNA pada DNA

"Mencari faktor pengawalseliaan pada genom, tidak semestinya menunjukkan apa yang mereka lakukan, tetapi ia berfungsi sebagai penanda generik yang sangat berguna dari pelbagai jenis elemen," kata John Stamatoyannopoulos. Dia membantu mempopulerkan pemetaan DNA secara genom dengan deoxyribonuclease I, atau DNase I, dalam projek termasuk ENCODE dan Roadmap Epigenomics Mapping Consortium. Laman web hipersensitif DNase-I, atau DHS, adalah kawasan DNA yang sangat mudah diakses oleh pembelahan, yang sering mencerminkan kehadiran urutan peraturan seperti penganjur.

Sejauh ini, projek ENCODE dan Roadmap Epigenomics telah memetakan DHS, dengan kira-kira 150 resolusi pasangan asas, di lebih daripada 100 jenis sel dan tisu dan peringkat perkembangan, kata Stamatoyannopoulos. "Anda menjumpai antara 100,000 dan 275,000 laman web hipersensitif DNase setiap jenis sel, atau 0,5% & ndash1,5% genom," walaupun dengan kadar penemuan palsu 1% yang ketat. "Angka sebenarnya sedikit lebih tinggi," katanya.

Di semua jenis sel, "kami mengesan kira-kira 2.2 juta kedudukan laman web hipersensitif DNase-I yang berbeza pada genom manusia," kata Stamatoyannopoulos. Dibandingkan dengan literatur, laman web ini merangkumi sekitar 96% dari semua elemen peraturan non-promoter yang diketahui, seperti penambah, peredam, dan penebat.

Perbezaan antara sel yang berbeza dalam struktur kromatin dan interaksi pengawalseliaan lain dapat mengubah pengikatan di laman web ini. "Kira-kira 340,000 adalah jenis sel tertentu," kata Stamatoyannopoulos, sementara "sekitar 7500 terdapat dalam setiap jenis sel." Selebihnya laman web menunjukkan corak ekspresi pertengahan yang kaya. Analisis pengelompokan pola-pola ini mengungkapkan hubungan hierarki yang tepat mencerminkan hubungan sel-sel yang sesuai, katanya. "Kami sedang melihat pengekodan proses perkembangan awal dan garis keturunan dalam corak DNA pengawalseliaan yang berterusan pada orang dewasa."

Salah satu mekanisme untuk mengatur ekspresi dalam tisu yang berbeza adalah organisasi kromatin berskala besar, yang dapat menyatukan urutan yang berada di bahagian yang sangat jauh dari molekul DNA. Untuk menangkap interaksi fizikal ini dalam vivo, Stamatoyannopoulos dan kolaboratornya menggunakan teknik pautan silang yang dikenali sebagai Chromosome Conformation Capture Carbon Copy, atau 5C. "Kami mendapat maklumat yang sangat sangat kuantitatif mengenai interaksi ini," kata Stamatoyannopoulos, dengan resolusi kira-kira satu kilobase.

Pada skala seluas genom, pemecahan DNase-I mendedahkan kawasan di mana enzim, dan mungkin faktor transkripsi, mempunyai akses percuma ke DNA. Tetapi pada skala yang lebih baik, protein faktor transkripsi yang mengikat kemudian menyekat akses oleh Dnase I, "meninggalkan gambaran negatif protein," kata Stamatoyannopoulos. "Dengan menjujukan data DNase-I dengan mendalam, anda dapat mengubah data pemetaan menjadi data jejak dengan berkesan untuk mengungkapkan pengikatan faktor transkripsi pada resolusi nukleotida."

Pada skala puluhan asas, "setiap jenis laman pengikat faktor transkripsi mempunyai corak pemisahan stereotaip DNase-I tersendiri, semacam cap jari," kata Stamatoyannopoulos. "Pola pembelahan ini sangat cocok dengan motif struktur yang dikenal pasti dalam kristalografi," tambahnya, dan juga dapat digunakan untuk mencari faktor-faktor tertentu dalam imbasan genom. Dia menekankan bahawa cap jari ini tidak menggambarkan kadar pemotongan mengikut urutan yang dijelaskan oleh Harmen Bussemaker.

Kedalaman jejak kaki dalam aktiviti DNase-I dapat digunakan untuk mengesan seberapa kerap faktor transkripsi menempati laman web. Stamatoyannopoulos dan rakan-rakannya mendapati bahawa penghunian ini berubah tepat seperti yang diharapkan semasa perubahan keadaan selular, misalnya semasa pembezaan. "Data ini bersifat kualitatif dan kuantitatif dari segi ukuran penghunian," katanya.

Para penyelidik juga mengembangkan teknik untuk mengesan faktor-faktor tertentu di laman web tertentu. Mereka pertama kali mereplikasi urutan di jejak kaki dan menandainya untuk membuat penyelidikan khusus untuk wilayah itu. Mereka kemudian menggunakan salah satu daripada dua teknik untuk mengesan pengikatan faktor transkripsi ke siasatan. Faktor-faktor yang terdapat antibodi yang sesuai dapat dikesan menggunakan Western blot. Untuk faktor lain, mereka menggunakan spektrometri jisim yang disasarkan untuk mencari peptida khas yang nisbah saiz dan casnya khusus untuk protein tertentu. "Kami tidak memerlukan antibodi lagi selagi anda dapat mengkloning faktor transkripsi," kata Stamatoyannopoulos. "Dengan pendekatan ini, anda dapat membuktikan bahawa protein sebenarnya melibatkan urutan motif tertentu, bahkan dalam konteks yang kompetitif dengan protein lain."

Penceramah:
Eran Segal, Institut Sains Weizmann
Harmen Bussemaker, Universiti Columbia

Sorotan

  • Rangka kerja berdasarkan mekanik statistik meramalkan kebarangkalian konfigurasi nukleosom dan faktor transkripsi pada DNA, berdasarkan pertalian urutannya.
  • Sistem ragi eksperimen membolehkan perbandingan kesan terhadap ekspresi urutan penganjur yang berbeza dengan ketepatan yang lebih baik daripada 10%.
  • Sebilangan besar, tetapi tidak semua, organisasi nukleosom dalam vivo ditentukan oleh pilihan urutan DNA mereka.
  • Urutan poli-adenosin, yang terlalu kaku untuk mudah masuk ke nukleosom, secara signifikan mengubah ekspresi yang dikendalikan dengan mengikat faktor transkripsi di dekatnya, dan nampaknya telah digunakan untuk tujuan ini semasa evolusi ragi.
  • Gambaran matriks berat yang biasa, yang menggambarkan pergantungan urutan pertalian antara protein dan DNA, mengabaikan pergantungan yang berpotensi penting antara asas pada kedudukan yang berbeza.
  • Kadar pembelahan oleh DNase I berbeza mengikut beberapa urutan besarnya dengan urutan DNA tempatan, dan memberikan maklumat mengenai pertalian dengan resolusi nukleotida tunggal.
  • Menggabungkan model pertalian dengan persilangan genetik membolehkan para penyelidik mencari kawasan yang mempengaruhi aktiviti faktor transkripsi, yang lebih kuat daripada pengenalan lokus untuk sifat lain.

Urutan kekhususan organisasi nukleosom

Memahami peraturan yang menentukan bagaimana transkripsi diatur, serupa dengan pemahaman kita tentang kod genetik, akan sangat berguna dalam biologi, kata Eran Segal. Tetapi "walaupun bertahun-tahun belajar, kami masih belum memahami banyak asas dan banyak persoalan asas masih terbuka." Sebilangan soalan yang lebih rumit melibatkan peranan elemen yang jauh seperti penambah, struktur kromatin, dan interaksi koperatif pelbagai peristiwa peraturan. Menjelaskan masalah yang kompleks ini memerlukan pemahaman kuantitatif tentang bagaimana ekspresi gen dipengaruhi ketika DNA berdekatan terikat oleh faktor transkripsi atau membungkus protein histon untuk membentuk nukleosom.

Untuk meneroka permasalahan ini, Segal dan rakan-rakannya telah mengembangkan kerangka pemodelan untuk meramalkan pengikatan bergantung pada urutan, dan sistem eksperimen yang dapat membezakan kuantitatif walaupun kesan transkripsi kecil dari perubahan urutan. Dengan mengubah urutan dan membandingkan hasilnya dengan model, mereka menguraikan peraturan organisasi urutan faktor transkripsi dan nukleosom yang bergantung pada urutan.

Kerangka pemodelan bermula dengan "lanskap afinitas," yang menerangkan bagaimana pertalian antara molekul dan DNA tertentu berbeza mengikut urutan. Untuk faktor transkripsi, pertalian ditentukan oleh urutan yang agak pendek, dan dapat disimpulkan dari data mikroarray yang mengikat protein. Eksperimen analog mendedahkan pengikatan sensitif urutan DNA dalam nukleosom, yang mencerminkan kawasan yang lebih besar dengan 147 pangkalan.

Perkaitan eksperimen diukur secara in vitro. "Kami ingin memahami bagaimana, dalam lanskap pertalian itu, dalam situasi yang dinamik, anda dapat memperoleh konfigurasi berbeza molekul terikat yang sebenarnya," kata Segal. Dengan menggunakan model statistik-mekanik, "dengan anggapan keseimbangan termodinamik, kita dapat menghitung secara tepat kebarangkalian sistem tersebut berada dalam salah satu konfigurasi ini." Kedudukan nukleosom yang diramalkan sesuai dengan dalam vivo eksperimen dalam yis. "Banyak, tetapi pastinya tidak semua, organisasi nukleosom dalam vivo ditentukan oleh pilihan urutan nukleosom, "Segal menyimpulkan." Kami memahami sejauh mana peraturan yang mengatur pilihan urutan nukleosom. "

Salah satu konsekuensi biologi dari pilihan yang mengikat adalah kesannya terhadap ekspresi gen yang berdekatan.Segal dan pasukannya telah mengembangkan sistem eksperimen dalam ragi yang memungkinkan penilaian kuantitatif perubahan ekspresi yang dihasilkan dari perubahan urutan di wilayah penganjur. Kerana konteks genomik selalu sama, "sistem mengawal banyak perkara yang berbeza," kata Segal. "Kita dapat membezakan perbezaan ekspresi yang sekecil 5 atau 10%."

Para penyelidik telah menggunakan sistem eksperimen ini untuk menjelaskan bagaimana perubahan urutan mempengaruhi ekspresi, dengan menukar kedua-dua penyokong semula jadi dan sintetik dan membuat perubahan sistematik dalam elemen peraturan. Segal membincangkan secara terperinci peranan urutan poli-adenosin (poli-A atau poli (dA: dT)), yang banyak terdapat pada genom eukariotik, terutama di wilayah-wilayah promoter. "Mereka menolak nukleosom kerana ketegaran dan ketidakmampuannya untuk menyesuaikan diri dengan lenturan tajam DNA yang diperlukan oleh struktur nukleosom," katanya. Penghapusan urutan seperti di dekat laman yang mengikat untuk faktor transkripsi GCN4 dalam ragi ditunjukkan lima belas tahun yang lalu untuk mengurangkan ekspresi gen yang diaturnya.

Kedekatan dan kedudukan urutan poli-adenosin yang berdekatan dalam DNA mempunyai kesan yang kuat terhadap pengikatan faktor transkripsi dan ekspresi gen yang dihasilkan.

"Kami ingin meneliti soalan-soalan ini dengan cara yang lebih sistematik dan komprehensif," kata Segal. Tanpa mengubah laman pengikatan GCN4, para penyelidik memodulasi ekspresi melalui pelbagai perubahan pada urutan poli-A yang berdekatan, yang mengubah kemungkinan pembentukan nukleosom berdekatan dan dengan itu menyekat akses faktor transkripsi ke laman pengikat. "Dengan membuat perubahan hanya pada urutan poly-A. Kita dapat memperoleh pengaruh dramatik pada tingkat ekspresi gen," Segal menyimpulkan.

Perubahan ekspresi yang dihasilkan sama besarnya dengan perubahan urutan di laman pengikatan, dan dapat memberikan cara untuk menyempurnakan ekspresi. Untuk melihat apakah evolusi telah memanfaatkan mekanisme ini, kumpulan Segal membandingkan penganjur untuk pelbagai komponen ribosom, yang perlu dihasilkan dalam jumlah yang sama. Mereka mendapati bahawa, untuk gen yang hanya mempunyai satu salinan, penganjur yang berkaitan cenderung mempunyai urutan poly-A berdekatan yang menjadikannya sangat dinyatakan, berbanding dengan gen yang mempunyai banyak salinan. Ini menunjukkan bahawa kawalan transkrip yang baik yang diberikan oleh organisasi nukleosom telah benar-benar dieksploitasi selama evolusi untuk mengimbangi variasi jumlah salinan.

Memodelkan interaksi DNA & ndashprotein

Harmen Bussemaker dan rakannya menggunakan matriks afiniti spesifik kedudukan yang dimotivasikan secara biofisik untuk menangkap kekhususan urutan. Mereka kemudian menggunakan pertalian pengikat yang dikira cis-kawasan peraturan untuk menganggarkan aktiviti pengawalseliaan setiap faktor transkripsi dalam keadaan sel tertentu.

Kegiatan pengawalseliaan faktor transkripsi, iaitu "berapa banyak aktiviti transkrip yang anda perolehi apabila pertalian penganjur meningkat," kata Bussemaker, dapat dianggap sebagai sifat. Para penyelidik memetakan pengaruh genetik pada aktiviti ini kepada sifat sifat kuantitatif, atau "aQTL," dari segregan ragi. "Kami dapat menentukan bukan hanya bagaimana tahap mRNA ditentukan oleh urutan bukan pengekodan tetapi juga naik satu tahap ke hulu dan memahami bagaimana aktiviti faktor transkripsi itu sendiri ditentukan," kata Bussemaker.

Menggabungkan hubungan pengiklan yang dihitung dengan data ekspresi membolehkan penyelidik membuat kesimpulan lokus (aQTL) yang mempengaruhi aktiviti pengawalseliaan.

"Ada kekuatan statistik yang cukup baik untuk ini," kata Bussemaker. Trend aktiviti kurang bising daripada tahap aktiviti individu yang digunakan dalam QTL ekspresi. Di samping itu, jumlah ujian terhad kepada kira-kira 100 faktor transkripsi, dan bukannya ribuan tahap ekspresi gen.

AQTL biasanya merangkumi 10 atau 20 gen, kata Bussemaker. "Variasi genetik ini mempengaruhi ekspresi, melalui faktor transkripsi, tetapi secara umum kita tidak mengetahui mekanisme tersebut." Sebaliknya, interaksi protein & ndashprotein memberikan maklumat molekul mekanistik tetapi mungkin tidak relevan dalam keadaan sel tertentu. Menggabungkan keduanya dapat menyempitkan bidang ke satu gen tertentu.

Dalam projek lain Bussemaker bekerjasama dengan John Stamatoyannopoulos untuk meneroka kekhususan urutan pembelahan oleh DNase I. Mengurai serpihan yang dihasilkan menunjukkan bahawa kadar pemotongan berbeza dengan dua atau tiga urutan besarnya, "jauh lebih banyak daripada yang anda jangkakan berdasarkan literatur," kata Bussemaker. Kerana kedudukan enzim dapat ditentukan dalam pasangan pasangan tunggal, kajian ini memberikan "kes ideal untuk pemodelan."

Para penyelidik menentukan kadar pemotongan untuk semua kemungkinan urutan heksamer yang merangkumi pemotongan. Model kedudukan-berat-matriks meramalkan kadar pemotongan jauh lebih buruk daripada urutan heksamer penuh, "jadi mesti ada kebergantungan yang signifikan antara kedudukan nukleotida," Bussemaker menyimpulkan. Dengan menggunakan set data lengkap, para penyelidik dapat mengukur kekuatan kebergantungan ini secara sistematik.

Huraian matriks berat-berat bagi pertalian mengikat mempertimbangkan setiap asas dalam motif secara bebas, tetapi Bussemaker memberi amaran bahawa pengiraan ini terlalu sederhana. "Penting untuk menjadi kuantitatif dan melampaui anggapan kebebasan matriks berat ini untuk dapat membezakan antara faktor-faktor ini," katanya.

Bussemaker dan rakannya juga mengkaji kekhususan urutan protein Hox. Percubaan secara in vitro "Kekhususan monomer tidak dapat benar-benar menjelaskan variasi kekhususan sasaran protein Hox dalam vivo, "katanya. Rakan-rakan Columbia, Barry Honig dan Richard Mann telah mencadangkan bahawa kekhususannya dalam vivo timbul apabila alur kecil DNA berinteraksi dengan simpang antara protein Hox dan kofaktor yang disebut extradenticle (Exd).

Bekerjasama dengan kumpulan Mann, postdocs Matt Slattery dan Todd Riley merancang perpanjangan SELEX (Systematic Evolution of Ligands by Exponential Enrichment), yang mengeksploitasi pemilihan makmal pengikatan DNA afinitas tinggi. Dengan berhenti sebelum pengayaan jenuh dan kemudian mengurutkan populasi yang diperkaya, kata Bussemaker, para penyelidik "mendapatkan maklumat kuantitatif mengenai kadar di mana urutan DNA yang dipilih, dan itulah sumber model kekhususan urutan yang baik."

Pasukan membandingkan pengikatan DNA dua protein Hox, Ubx dan Scr, keduanya di hadapan Exd. Pengikatan kekuatan diubah dengan kuat oleh dua pangkalan pusat dalam motif pengikat. "Mudah-mudahan itu akhirnya akan membolehkan orang memahami dalam vivo mengapa Hoxes ini boleh mempunyai sasaran yang berbeza, "kata Bussemaker.

Penyelaras Keseluruhan:
Gustavo Stolovitzky, IBM
Robert Prill, IBM
Raquel Norel, IBM

Penceramah Cabaran:
Hans-Juergen Thiesen, Universiti Rostock
Rob Patro, Universiti Maryland
Nicola Barbarini, Universiti Pavia
Matt Weirauch, Universiti Toronto
Matti Annala, Universiti Teknologi Tampere
Yaron Orenstein, Universiti Tel Aviv
Alberto de la Fuente, CRS4
Matthieu Vignes, INRA-Toulouse
Po-Ru Loh, Institut Teknologi Massachusetts
Daniel Marbach, Institut Teknologi Massachusetts
V & acircn Anh Huynh-Thu, Universiti Li & egravege
Robert K & uumlffner, Universiti Ludwig Maximilian

Sorotan

  • DREAM, Dialog untuk Penilaian dan Kaedah Kejuruteraan Terbalik, membolehkan para penyelidik bekerjasama dengan persaingan untuk menyelesaikan masalah yang diilhamkan secara biologi atau biologi dengan jawapan yang diketahui, tetapi ditahan.
  • Cabaran tahun ini merangkumi dua yang menggabungkan data simulasi dari rangkaian yang diketahui dengan data biologi yang diukur.
  • Gabungan ramalan yang tepat dari semua pasukan biasanya mengalahkan pasukan yang terbaik, kerana kekuatan dan kelemahan teknik yang berbeza.

Pengenalan

Tujuan berterusan dalam persidangan DREAM (Dialog untuk Penilaian dan Kaedah Kejuruteraan Terbalik) adalah untuk menentukan se objektif mungkin seberapa baik penyelidik dapat membuat kesimpulan dan meramalkan realiti biologi. Pertandingan buta yang dikenali sebagai DREAM Challenges adalah wahana untuk penilaian itu. Jauh sebelum setiap perjumpaan, penganjur Gustavo Stolovitzky, Robert Prill, dan Julio Saez-Rodriguez bekerja dengan penyelidik lain untuk mengumpulkan empat set data yang tidak diterbitkan atau tersembunyi.

Tugasnya berubah dari tahun ke tahun, dan dipilih untuk menerangkan masalah biologi penting dan mencabar, tetapi mudah-mudahan dapat diselesaikan, masalah komputasi. Satu masalah berulang dalam memilih masalah adalah konflik antara spesifikasi matematik yang sempurna dan ketepatan biologi. Sebagai sebahagian daripada usaha berterusan untuk menguji kesesuaian biologi tugas, dua cabaran tahun ini menggunakan kedua-dua data biologi sebenar dan data simulasi di bahagian yang berbeza dari cabaran.

Data tersebut tersedia untuk banyak pasukan penyelidik, yang berusaha mengekstrak peraturan atau struktur yang tidak diungkapkan yang menimbulkan data, atau membuat ramalan tentang data tambahan yang telah ditahan. Ramalan dari 73 pasukan, yang keanggotaannya tidak diumumkan, disusun, dijaringkan dan dibandingkan oleh Prill, Raquel Norel, dan Gustavo Stolovitzky, dan diatur dalam laman web projek DREAM dengan sokongan dari Tom Garben dan Aris Floratos di Columbia University. Dalam kebanyakan kes, prestasi gabungan semua ramalan lebih baik daripada ramalan individu, dan Prill, Norel, dan Daniel Marbach menerangkan cara-cara yang mungkin digunakan oleh masyarakat untuk menggunakan kebijaksanaan kolektif itu.

Pasukan individu yang berprestasi terbaik untuk masing-masing dari empat cabaran itu dijemput untuk bercakap secara ringkas di persidangan mengenai kaedah mereka. Penganjur juga mengambil perhatian pasukan lain untuk penyataan yang terhormat. Berikut ini merangkumi pelbagai cabaran, hasil keseluruhan, dan pendekatan yang dilakukan oleh pemain terbaik.

DREAM Challenge 1: Epitope & ndashantibody recognition

Cabaran pertama meminta para peserta untuk meramalkan sama ada peptida individu akan bertindak balas dengan kuat, atau tidak sama sekali, dengan campuran antibodi yang tersedia secara komersial. Hans-Juergen Thiesen dan rakannya mengumpulkan data eksperimen untuk cabaran menggambarkan set peraturan untuk pengiktirafan epitop & ndashantibody (EAR).

Campuran antibodi yang pelbagai, yang disebut imunoglobulin intravena, atau IVIG, digunakan secara klinikal dan diperoleh dari 10,000 hingga 100,000 orang yang sihat. Peptida kebanyakannya sesuai dengan urutan dari genom manusia, tetapi beberapa diubah sedikit dan yang lain secara rawak. Peptida ini disintesis dan disusun pada ketumpatan tinggi pada slaid kaca untuk pembacaan kuantitatif. Pasukan menerima senarai lebih daripada 13,000 urutan peptida yang telah bertindak balas dengan kuat atau tidak sama sekali dengan IVIG, dan diberi sebilangan urutan yang serupa untuk diklasifikasikan. Pada prinsipnya, cabarannya adalah untuk mencari peraturan atau atribut umum yang menentukan interaksi antibodi dengan urutan peptida, contohnya interaksi antibodi dengan epitop linear. Subchallenge "pusingan bonus" meminta pasukan untuk meramalkan urutan peptida yang memenuhi syarat untuk menjadi kuat atau tidak mengikat sama sekali untuk IVIG.

Dua prestasi terbaik untuk cabaran 1 jauh lebih baik pada ramalan daripada pasukan lain. Pelakon Terbaik adalah Pasukan Pythia, dibentuk oleh Rob Patro dan Carl Kingsford dari University of Maryland. Mereka berpuas hati pada pelaksanaan mesin sokongan-vektor, dan menggabungkan sebilangan besar ciri calon untuk klasifikasi. Pengelasan terbaik tunggal adalah komposisi asid amino tempatan, kata Patro, jadi "ciri mudah tidak boleh diketepikan." Pengiraan struktur geometri dok terbaik menggunakan Zdock menunjukkan prestasi terburuk sebagai pengkelasan tunggal. "Ada banyak ruang untuk peningkatan," katanya.

Pasukan Pavia, yang terdiri daripada Nicola Barbarini, Alessandra Tiengo dan Riccardo Bellazzi dari University of Pavia, berada di kedudukan kedua. Mereka menilai sebilangan besar ciri urutan, termasuk beberapa proksi untuk ciri struktur tetapi tidak ada pemodelan struktur yang komprehensif. Mereka menggunakan pendekatan meninggalkan-satu-keluar untuk melatih pelbagai algoritma, dan mendapati bahawa prestasi terbaik datang dengan model regresi linear, dan mengeksploitasi 28 atribut. Tidak ada peraturan yang menguasai klasifikasi.

Peptida yang diramalkan dalam pusingan bonus oleh kedua-dua kumpulan berprestasi terbaik kini disahkan secara eksperimen oleh kumpulan Hans-Juergen Thiesen.

DREAM Challenge 2: Transcription-factor & ndashDNA motif recognition

Cabaran kedua menyangkut ramalan motif pengikatan faktor transkripsi dalam urutan DNA. Matt Weirauch dan Tim Hughes dari University of Toronto mengumpulkan data dari Protein-Binding Microarrays (PBM).

Paradigma semasa untuk menilai urutan, kata Weirauch, adalah matriks berat-kedudukan, yang hanya menggabungkan sumbangan dari nukleotida pada setiap kedudukan. "Ini menjadi lebih jelas bahawa ada masalah dengan pendekatan ini," katanya. Secara khusus, ia tidak dapat menangani jurang lebar berubah antara bahagian motif, faktor transkripsi dengan beberapa mod pengikatan, dan pergantungan antara residu pada posisi yang berbeza seperti yang dijelaskan oleh Harmen Bussemaker.

Peserta menerima data kekhususan yang mengikat untuk 20 faktor transkripsi yang berbeza dari dua susunan PBM yang mengandungi urutan probe yang berbeza. Probe dalam setiap susunan dirancang sedemikian rupa sehingga semua urutan 10-basis yang mungkin ada sekali, jadi semua kemungkinan urutan 8-mer hadir 32 kali. Pasukan kemudian meramalkan hubungannya dengan 66 faktor lagi, 33 untuk setiap jenis susunan. Cabaran "pusingan bonus" meminta pasukan menamakan faktor transkripsi tanpa nama.

Pemain terbaik dalam cabaran utama dan pusingan bonus adalah Pasukan csb_tut, yang terdiri daripada Matti Annala dari Tampere University of Technology, Kirsti Laurila, Matti Nykter, dan Harri L & aumlhdesm & aumlki. Mereka menggunakan model pertalian linear yang merangkumi kpanjangnya antara 4 dan 8, tetapi mengatur data yang terlalu ketat dengan hanya menyimpan yang paling bermaklumat k-kawan. Mereka melakukan beberapa pembetulan pada data PBM untuk artifak dan ketepuan isyarat, dan merasa penting untuk memasukkan urutan penghubung yang digunakan untuk membina susunan dalam analisis mereka. Untuk mengenal pasti nama-nama faktor transkripsi, mereka menilai kesamaan urutan dengan motif dalam pangkalan data TRANSFAC dan JASPAR.

Berkongsi prestasi terbaik dalam pusingan bonus adalah ACGT Pasukan, Yaron Orenstein, Chaim Linhart, dan Ron Shamir dari Universiti Tel Aviv. Mereka menggunakan makmal mereka Amadeus pencari motif, yang dirancang untuk mencari urutan di wilayah penganjur. Kaedah yang paling jelas untuk menggunakan alat ini, bagaimanapun, hanya memberikannya penyiasatan dengan pengikatan tertinggi, "gagal total" pada set latihan, kata Orenstein. Apa yang berjaya adalah memberi peringkat kepada semua k-mers berdasarkan pengikatan probe, dan memberi mereka yang paling bermaklumat k-kawan ke Amadeus. Khususnya, mereka rata-rata kekuatan pengikatan dari semua probe yang berisi masing-masing 9-mer dan memberikan 1000 peringkat teratas sebagai urutan input kepada Amadeus untuk mencari matriks berat motif kedudukan lebar 8.

Cabaran IMPIAN 3: Genetik sistem

Cabaran ketiga menyangkut data dari memisahkan populasi, bidang yang dikenali sebagai sistem genetik atau genetik genetik. Data tersebut meliputi data simulasi dan data yang diukur dari tanaman, dan dikumpulkan oleh Alberto de la Fuente dan rakan-rakannya.

Data genetik dan fenotipik gabungan dari segregan yang dihasilkan dari persilangan antara strain inbred telah dibincangkan dalam beberapa ceramah utama pada persidangan ini, termasuk yang oleh Charlie Boone, Leonid Kruglyak, Michael Snyder, dan Harmen Bussemaker. Seperti yang digambarkan oleh perbincangan itu, variasi genetik yang semula jadi tetapi sangat terkawal di antara segregan menghasilkan maklumat yang kuat mengenai penyumbang genetik kepada fenotip. Cabaran sistem-genetik DREAM harus memberikan gambaran berterusan mengenai penilaian jenis data ini.

Bahagian A dari cabaran tersebut menggunakan data sistem-genetik simulasi. Para penyelidik pertama kali menghasilkan rangkaian 1000 gen dengan topologi bebas skala modular menggunakan SysGenSIM, alat yang dikembangkan oleh makmal de la Fuente dan Ina Hoeschele. Mereka memodelkan interaksi antara gen menggunakan persamaan pembezaan tidak linear. Parameter model ini menggambarkan kadar transkripsi basal (cis) atau kesannya pada gen sasaran (trans) dipilih dari dua nilai, mewakili alel induk, dan ekspresi gen keadaan mantap dikira.

Peserta diberi tahap ekspresi dan alel ibu bapa yang sesuai untuk semua 1000 gen, untuk persilangan simulasi antara ibu bapa. Subchallenge A1, A2, dan A3 mempunyai populasi 100, 300, dan 999 keturunan. Pasukan kemudian melaporkan kelebihan pada grafik yang diarahkan, mengikut keyakinan. "Jaringan ini jauh lebih besar daripada yang pernah kita lakukan di DREAM sebelumnya," komentar Prill, "jadi kami meminta hanya 100,000 tepi pertama."

Pemain terbaik di Bahagian A adalah Pasukan SaAB_meta dan SaAB Dantzig, Matthieu Vignes, J. Vandel, N. Ramadan, D. Allouche, C. Cierco, S. De Givry, Brigitte Mangin, dan Thomas Schiex dari INRA-MIA di Toulouse. Mereka pertama kali melakukan ujian regresi untuk membezakan cis- dan trans-terlakukan alel. Untuk analisis lebih lanjut, mereka menjalankan tiga algoritma yang berbeza: rangkaian Bayesian, regresi Lasso, dan Pemilih Danzig. Mereka kemudian menggabungkan tiga teknik tersebut ke dalam algoritma Meta yang memberikan hasil terbaik mereka.

Bahagian B menggunakan data dari tanaman kacang soya, yang dihasilkan di Virginia Bioinformatics Institute, untuk melihat apakah peserta dapat meramalkan dua fenotip mengukur kerentanan mereka terhadap cetakan. Tumbuhan berasal dari persilangan antara nenek moyang yang tahan terhadap patogen dan yang sensitif. Genotip untuk 941 gen dan ekspresi gen pra-pendedahan untuk 28,397 gen disediakan untuk 200 tumbuhan yang berbeza. Pasukan diminta untuk memprediksi fenotip untuk 30 keturunan lain, hanya menggunakan genotip (B1), hanya ekspresi gen pra-pendedahan (B2), atau keduanya (B3).

Secara keseluruhan, hasilnya "tidak terlalu baik," kata de la Fuente, terutama pada genotip saja, jadi mungkin tugasnya harus lebih sederhana. Prill berkomentar bahawa, terutama untuk tantangan B1, "semua tim berkolerasi satu sama lain, dan tidak ada yang berkorelasi dengan standar emas" (data yang diukur). Namun, dua pemain membuat ramalan fenotip yang signifikan secara statistik.

Pemain terbaik untuk Bahagian B2 adalah Orangeball berpasukan, Po-Ru Loh, George Tucker, Michael Yu, dan Bonnie Berger dari Institut Teknologi Massachusetts. Dengan data ekspresi untuk begitu banyak gen, cabarannya adalah untuk mengetahui "20,000 dari mana yang akan menjadi gen yang sebenarnya memberitahu anda tentang fenotip," kata Loh. Cabaran ini bertambah buruk dengan kemungkinan adanya korelasi antara peramal, baik genotip maupun fenotip. Variasi ini didominasi oleh outliers ekstrem, yang ditekankan oleh pasukan dengan menggunakan transformasi susunan peringkat.Untuk menjelaskan kemungkinan interaksi nonlinier antara peramal, mereka merangkumi kombinasi genotip Boolean. Pada akhirnya, segelintir ramalan yang dipilih dengan baik mencapai sebahagian besar prestasi.

Pemain terbaik di Bahagian B3, Kumpulan RNI_kumpulan, yang terdiri daripada Madhuchhanda Bhattacharjee dari University of Pune dan Mikko Silanp & auml & auml dari University of Helsinki tidak dapat mengemukakan kaedah mereka.

Cabaran 4: Inferens Rangkaian

Cabaran keempat menilai tujuan biologi umum untuk menyimpulkan empat rangkaian peraturan transkrip dari data ekspresi berikutan gangguan. Data dikumpulkan oleh Daniel Marbach, Jim Costello, Diogo Camacho, dan Jim Collins.

Cabaran ini berdasarkan pengalaman dari tahun-tahun sebelumnya dengan "dalam silico"jaringan, di mana jaringan yang menghasilkan data dikenal dengan tepat. Untuk DREAM5, rangkaian simulasi, yang diilhami oleh Escherichia coli, dengan syarat hanya satu daripada empat set data. Kumpulan data kedua berdasarkan ungkapan untuk Staphylococcus aureus, di mana belum ada rangkaian rujukan yang dapat dianggap sebagai standard emas. "Semoga ahli biologi akan lebih bersemangat jika kita mula memfokuskan bukan hanya pada penanda aras tetapi pada ramalan berasaskan komuniti ini," kata Marbach. Kumpulan data ketiga dan keempat diukur dalam E coli dan ragi pemula Saccharomyces cerevisiae, di mana rangkaian asasnya cukup mapan.

Peserta diberi senarai gen dan sejumlah besar data ekspresi mikroarray, tanpa nama dari data asal. Mereka juga diberi informasi tambahan seperti kondisi eksperimen, dan juga beberapa faktor transkripsi calon.

Ramalan itu dinilai untuk prestasi yang konsisten di seluruh rangkaian, tetapi "Saya melihat kepelbagaian yang hebat dalam persembahan pelbagai pasukan" di rangkaian yang berbeza, Prill mengulas. Khususnya, ramalan ragi "mengerikan." The S. aureus jaringan tidak dijaringkan, kerana tidak ada standard emas, tetapi akan digunakan sebagai asas untuk ramalan masyarakat. Dua prestasi keseluruhan terbaik adalah kedua-dua pemimpin yang kembali dari DREAM4.

Pemain terbaik keseluruhan dan dalam silico adalah Pasukan ulg_biomod, terdiri daripada V & acircn Anh Huynh-Thu, Alexandre Irrthum, Louis Wehenkel, dan Pierre Geurts, dari University of Li & egravege, dan Yvan Saeys dari Ghent University. Mereka menggunakan model berdasarkan keputusan, hanya berdasarkan data ekspresi. Huynh-Thu menyatakan bahawa ramalan itu meningkat secara mendadak apabila faktor transkripsi diketahui. Di samping itu, walaupun pasukan ini jauh lebih baik daripada yang lain di dalam silico data, prestasi mereka untuk dalam vivo data "hanya kompetitif."

Pelakon terbaik dalam vivo, dan tempat kedua secara keseluruhan, adalah Pasukan Amalia, termasuk Robert K & uumlffner, Florian Erhard, Tobias Petri, Lukas Windhager, dan Ralf Zimmer dari Ludwig Maximilian University. Untuk menentukan interaksi calon antara faktor transkripsi dan kemungkinan gen sasaran, pasukan menggunakan ujian ANOVA. Ini tidak memerlukan linearitas, seperti yang diasumsikan dalam koefisien korelasi, atau diskretisasi data, yang diperlukan untuk rangkaian Bayesian atau teknik maklumat bersama. Teknik ini berfungsi dengan baik E coli. Tetapi untuk rangkaian ragi, di mana semua pasukan melakukan dengan buruk, dan tanpa skor S. aureus rangkaian, jumlah eksperimen gangguan dalam set data terlalu kecil untuk mengharapkan hasil yang dapat dipercayai, kata K & uumlffner. Meskipun demikian, dia menganggap masuknya dalam vivo data menjadi "langkah besar ke hadapan" untuk IMPIAN.


Di mana untuk mencari?

Pola yang dijumpai di antara kawasan pengawalseliaan kumpulan gen yang dikekspresikan biasanya akan menjadi PWM, seperti yang berasal dari TFBS yang diketahui. Namun, tangkapannya adalah bahawa pemeriksaan PWM untuk laman web yang mengikat sebenarnya telah mengajar kita untuk tidak mengharapkan corak yang ditentukan dengan kandungan maklumat yang tinggi. Sebaliknya, corak yang didefinisikan dengan buruk seperti yang sebenarnya dapat dengan mudah diekstrak dari sekumpulan kawasan hulu jika hanya wilayah yang dipilih cukup besar. Ini menunjukkan keterbatasan keupayaan untuk mengenal pasti corak dari gen yang diatur bersama. Walaupun begitu, dalam ragi terdapat banyak kejayaan dengan de novo pengenalan motif [84]. Pengenalan corak di Drosophila telah mendapat banyak keuntungan dari banyak urutan yang kini tersedia bersama dengan wilayah penambah yang cukup jelas yang terdiri daripada unsur-unsur peraturan yang jelas. Urutan peraturan vertebra, bagaimanapun, jauh lebih sukar untuk dikenalpasti. Kesukaran berpunca dari kurangnya pengetahuan tentang cara menyempitkan kawasan urutan untuk mencari corak, dan mungkin dari sifat CRM vertebrata yang tidak rata.

Terdapat beberapa cara untuk menyempitkan kawasan urutan untuk mencari corak peraturan. Pertama, pengenalpastian sistematik cDNA lengkap bersama dengan teknologi baru seperti teg ekspresi gen analisis (CAGE) telah menyebabkan pengenalan laman web permulaan transkripsi manusia dan tikus yang sangat tepat [85]. Oleh itu, memberi tumpuan kepada urutan penganjur adalah kurang tekaan hari ini daripada beberapa tahun yang lalu. Satu harga yang harus dibayar, bagaimanapun, adalah peningkatan kerumitan definisi promoter yang dihasilkan dari pandangan bahawa promoter alternatif untuk gen lebih merupakan peraturan daripada pengecualian. Oleh itu, adalah wajar untuk mengkaji beberapa penyokong per gen. Pengertian penambah dulu ditakrifkan secara biologi, tetapi dengan urutan genomik yang lebih lengkap dan lengkap, penambah cenderung dikenali dengan kawasan bukan kod yang sangat terpelihara. Pemetaan sistematik laman web hipersensitif DNase I juga menyumbang untuk menentukan kawasan penambahbaikan. Walau bagaimanapun, dengan mengenal pasti laman web permulaan transkrip yang jauh di hulu dari permulaan terjemahan, semakin sukar untuk membezakan dengan jelas antara penambah dan penganjur.


Genomik pengawalseliaan cis untuk biologi sistem

Ekspresi gen dikendalikan oleh interaksi antara faktor trans-pengawalseliaan dan urutan DNA cis-regulasi, dan interaksi ini merupakan hubungan fungsional penting dari rangkaian peraturan gen (GRN). Pengesahan model GRN memerlukan ujian pengawalseliaan cis eksperimental mengenai hubungan yang diramalkan untuk mengesahkan identiti dan fungsi yang dicadangkan. Walau bagaimanapun, analisis peraturan-cis, pada masa ini, berada dalam kemacetan yang teruk dalam biologi sistem genom kerana metodologi eksperimen menuntut yang sedang digunakan untuk menemui modul peraturan cis (CRM), dalam genom, dan untuk mengukur aktivitinya. Di sini kami menunjukkan pendekatan throughput tinggi untuk penemuan dan pencirian kuantitatif CRM. Aspek uniknya ialah penggunaan tag urutan DNA untuk "barcode" konstruksi ekspresi CRM, yang kemudiannya dapat dicampurkan, disuntikkan bersama ke dalam telur landak, dan kemudian dibubarkan. Kaedah ini telah meningkatkan kadar analisis peraturan-cis sebanyak & gt100 kali ganda berbanding dengan ujian wartawan satu demi satu konvensional. Kegunaan pemberita label DNA ditunjukkan oleh penemuan pesat 81 CRM aktif dari 37 gen landak laut yang belum diterokai sebelumnya. Kami kemudian memperoleh pencirian temporal resolusi tinggi serentak dari aktiviti pengawalseliaan lebih daripada 80 CRM. Rata-rata 2-3 CRM ditemui setiap gen. Perbandingan profil ekspresi gen endogen dengan CRM yang dipulihkan dari setiap gen menunjukkan bahawa, untuk kebanyakan kes, sekurang-kurangnya satu CRM aktif dalam setiap fasa ekspresi endogen, menunjukkan bahawa pemulihan CRM adalah menyeluruh. Pendekatan ini secara kualitatif akan mengubah amalan pembinaan GRN dan juga pengesahan, dan akan mempengaruhi banyak bidang tambahan biologi sistem peraturan.

Penyataan konflik kepentingan

Penulis menyatakan tidak ada konflik kepentingan.

Angka

Pengukuran selari bagi dalam vivo ...

Pengukuran selari bagi dalam civ vivo -kegiatan pengawalseliaan banyak urutan DNA dengan…

Pembahagian bilangan…

Pembahagian bilangan CRM yang dijumpai untuk setiap gen. Gen dikategorikan…

Skor kecukupan sementara ( S…

Skor kecukupan sementara ( S t CRM. The S t nilai…


Mentafsirkan genom pengawalseliaan: genomik fungsi faktor transkripsi di Drosophila melanogaster

Penyelidik kini mempunyai akses ke genom Drosophila melanogaster yang diuraikan sepenuhnya selama lebih dari satu dekad, dan genom yang diuruskan dari 11 spesies Drosophila tambahan telah tersedia selama hampir 5 tahun, dengan lebih banyak genom spesies tersedia setiap tahun [Adams MD, Celniker SE, Holt RA, et al. Urutan genom Drosophila melanogaster. Sains 2000287: 2185-95 Clark AG, Eisen MB, Smith DR, et al. Evolusi gen dan genom pada filogeni Drosophila. Alam 2007450: 203-18]. Walaupun faktor transkripsi D. melanogaster (TF) yang dikaji paling baik diklon sebelum penjujukan genom, ketersediaan data urutan berjanji untuk mengubah pemahaman kita mengenai TF dan rangkaian peraturan gen. Genom yang berurutan telah membolehkan para penyelidik menghasilkan alat untuk pencirian tahap tinggi tahap ekspresi gen, penyetempatan TF seluruh genom dan analisis kekangan evolusi pada elemen DNA di pelbagai spesies. Dengan kira-kira 700 protein pengikat DNA dalam genom Drosophila, akan bertahun-tahun sebelum setiap TF spesifik urutan berpotensi dikaji secara terperinci, namun sedekad terakhir penyelidikan genomik berfungsi telah mempengaruhi pandangan kita mengenai rangkaian pengatur gen dan DNA TF pengiktirafan.

Angka

Perbandingan sepasang pengikatan TF…

Perbandingan secara berpasangan antara pengikatan TF bertindih, dengan (kiri) atau tanpa (kanan) TF…


Tonton videonya: Biologi - Mutasi Genetika jornalacademy (Disember 2021).