Ročníkový projekt

Názov projektu: Analýza frekvencií oligomerov v genomických dátach

Meno študenta: Eva Herencsárová

Email: herencsareva@gmail.com

Školiteľka: doc. Mgr. Bronislava Brejová, PhD.

Email: brejova@dcs.fmph.uniba.sk

Konzultant: Mgr. Askar Gafurov

Email: gafurov@dcs.fmph.uniba.sk

Stručný popis: Genóm sa skladá z DNA, ktorý môžeme chápať, ako reťazec tvorený symbolmi A, C, G, T. Ľudský genóm, ktorý obsahuje genetické inštrukcie, má veľkosť okolo 3.2 GB.
V tomto projekte chceme skúmať, ako často sa opakujú k-mery (sekvencie v DNA dĺžky k) v DNA. Keďže "veľkosť" ľudského genómu je relatívne veľká, najprv sa budeme zaoberať s genetickou informáciou baktérie E. coli (veľkosť okolo 4.5 MB). Vytvoríme histogram početnosti, ktorú následne budeme analyzovať.

Cieľ zimného semestra:

  • 1. fáza: Analýza 1 histogramu: vytvoríme štatistický model, krivku, ktorá čo najpresnejšie opisuje náš histogram
  • 2. fáza: Zopakovanie analýzy pre rôzne organizmy
  • Cieľ letného semestra:

  • Analýza frekvencií pokrytia zo sekvenačných čítaní a rôznych faktorov, ktoré ich frekvenciu ovplyvňujú
  • Report

    Zdrojový kód pre zimný semester: GitHub

    Zdrojový kód pre letný semester: GitHub