Giter VIP home page Giter VIP logo

5-hw-ribo-seq's Introduction

15/12/2022 Удалила ненужные аутпуты, добавила .head() к датасетам и догрузила файлы в репозиторий

Задание 1 (6 баллов). Определение дифференциальной экспрессии

В архиве хранится файл 01. RiboSeq_RNASeq_HCC_counts.tsv, в котором содержится матрица каунтов результатов Ribo-Seq и RNA-Seq экспериментов больных гепатоцеллюлярной карциномой. Матрица каунтов была получена стандартным воркфлоу STAR. На каждого пациента приходится 4 столбца в таблице (RNA-Seq нормы и опухоли, Ribo-Seq нормы и опухоли), записанные в виде sample_number-tissue_type-experiment.

1.1 (1 балл). Для каждого гена найдите коэффициент корреляции числа каунтов между экспериментами RNA-Seq и Ribo-Seq. Какую корреляцию вы выберете — Пирсона или Спирмена? Обратите внимание, что перед вами не нормированные на глубину библиотеки каунты, учтите это при анализе.

1.2 (1 балл). Постройте гистограмму распределения этих коэффициентов корреляции. Для каких генов корреляция самая высокая, а для каких — самая низкая? Как вы можете это объяснить?

1.3 (1 балл). Проанализируйте распределение каунтов Ribo-seq: постройте зависимость дисперсии от среднего. Похоже ли это на NB-распределение? Если нет, то на какое похоже? Если да, то какие статистические тесты можно использовать для подтверждения того, что перед вами NB-распределение?

1.4 (3 балла). Найдите дифференциально экспрессированные гены по RNA-Seq между нормой и опухолью. Для этого можете использовать DESeq2 или edgeR (для DESeq есть обёртка на Python). Постройте volcano plot. То же самое сделайте и для Ribo-Seq эксперимента. Совпадают ли результаты дифференциальной экспрессии? Какие гены оказались значимо различны по экспрессии в одном случае, а какие — в другом? Проведите похожий анализ, только с поиском генов с разницей в эффективности трансляции (~ method + condition + method:condition). Что вы скажете о наборе генов, который вы получили этим методом? Выводы подкрепите графиками.

Задание 2 (4 балла). Анализ wig-файла

В архиве хранятся два файла с .wig-трэками Ribo-Seq эксперимента кишечной палочки: 02. RiboSeq_EColi_track_f.wig и 02. RiboSeq_EColi_track_r.wig для прямой и обратной цепочек соответственно. Трэки эти были получены следующим образом: сначала прочтения прошли QC, адаптеры были удалены, а получившиеся «чистые» риды были откартированы на геном кишечной палочки. Затем каждой геномной позиции были присвоены значения, соответствующие числу 3’-концов прочтений, был определён оффсет для определения P-сайта, после чего скорректированные на этот оффсет значения и были записаны в wig-файл. Референсный геном, использовавшийся в ходе обработки прочтений, — U00096.3. Для выполнения заданий вам потребуется его аннотация (её вы можете найти в GenBank).

2.1 (2 балла). Присутствует ли в покрытии генома неравномерность? Рассмотрите неравномерность покрытия на примере любого выбранного вами гена. Что вы можете сказать про эту неравномерность? Присутствует ли там периодичность в три нуклеотида? А если взять среднее по большому количеству генов (взяв за точку отсчёта старт-кодон)? Выводы проиллюстрируйте графиками.

2.2 (1 балл). Рассчитайте значения RPKM и TPM для каждого гена. В чём разница между RPKM и TPM?

2.3 (1 балл). Проанализируйте значения RPKM для генов из оперона ATP. Укажите геномные координаты оперона, а также то, какие гены в него входят. Есть ли разница между RPKM у различных генов, присутствующих в опероне? Как вы можете объяснить эту разницу с биологической точки зрения? Как вы думаете, можно ли оценить эту разницу при помощи классического RNA-Seq

5-hw-ribo-seq's People

Contributors

anuytok avatar

Watchers

Sergey Isaev avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.