Grafové neurónové siete na identifikáciu plazmidov

Meno: Bc. Monika Buchalová

Školiteľ: doc. Mgr. Tomáš Vinař, PhD.

E-mail: buchalova6@uniba.sk

Anotácia

Identifikácia plazmidov v sekvenačných dátach s krátkymi čítaniami je dôležitou úlohou.

Abstrakt

Cieľom tejto diplomovej práce je aplikovať mechanizmus pozornosti (attention) na problém klasifikácie kontigov v assembly grafoch pomocou architektúry plASgraph2. Plazmid je malý kruhovito stočený úsek DNA, ktorý sa nachádza voľne v cytoplazme baktérií. Práve plazmidy sú častou príčinou šírenia antibiotickej rezistencie medzi bak- tériami. Identifikácia plazmidov z krátkych sekvenčných dát je však náročná. V práci sa preto zameriavame na využitie Graph Attention Networks (GAT) ako súčasti grafovej neurónovej siete, ktorá rozhoduje, či daný kontig pochádza z plazmidu, z chromozómu alebo má nejednoznačný pôvod. Súčasťou práce je analýza existujúcich riešení, aktual- izácia softvérového kódu pre nové verzie knižníc a príprava experimentálneho prostredia pre ďalší výskum.

Dokumenty

Aktuálna verzia diplomovej práce

Stiahnuť PDF

Prezentácia

Stiahnuť PDF

Zdrojové kódy

Zdrojové súbory diplomovej práce sú dostupné na stiahnutie vo formáte ZIP:

Stiahnuť ZIP

Link na github repozitár so zdrojovými kódmi:

Github

Kalendár úloh pre akademický rok 2024/2025

Úloha Stav Dátum
Analýza článkov GAT a plASgraph2 ✅ Hotovo marec 2025
Testovanie kódu a knižníc ✅ Hotovo apríl 2025
Implementácia vlastnej úpravy ✅ Hotovo máj 2025

Kalendár úloh pre akademický rok 2025/2026

Úloha Stav Dátum
Implemetácia attention mechanizmu ✅ Hotovo november 2025
Vytvorenie experimentov ✅ Hotovo november 2025
Evaluácia klasifikácie a jej vyhodnotenie ✅ Hotovo novemver 2025
Urobiť evaluáciu pomocou scriptu, ktorý sa použil na evaluáciu v článku, keďže moja evaluácia sa nezhoduje s článkom 🕒 Plánované december 2025
Porovnanie dvoch evaluačných scriptov, nájdenie chyby 🕒 Plánované december 2025
Úprava štruktúry grafu, pre maximálne zefektívnenie attention mechanizmu 🕒 Plánované január 2025
Vytvorenie a evaluácia experimentov pre vylepšenú verziu grafu 🕒 Plánované február 2025
Porovnanie výsledkov s existujúcimi nástrojmi 🕒 Plánované marec 2025

Vizualizácia výsledkov

Label
Vizualizácia predikovaných hodnôt
Plasmid score
Vizualizácia plazmidových skór
Both
Vizualizácia predikovaných hodnôt a plazmidových skór

Zdroje

  1. Sielemann, Janik, et al. "plASgraph2: using graph neural networks to detect plasmid contigs from an assembly graph." Frontiers in Microbiology 14 (2023): 1267695.
  2. plASgraph2.pdf
  3. Veličković, Petar, et al. "Graph attention networks." arXiv preprint arXiv:1710.10903 (2017).
  4. graph_attention_networks.pdf
  5. Líndez, Pau Piera, et al. "Accurate plasmid reconstruction from metagenomics data using assembly-alignment graphs and contrastive learning." bioRxiv (2025): 2025-02.
  6. accurate_plasmid_reconstruction.pdf