izvorni znanstveni rad
Računalno potpomognuto određivanje virusnih varijanti i heterogenosti virusne populacije
Sažetak
Obrada velikih skupova bioloških podataka izuzetno je kompleksna zbog problema povezivanja biologije i računarstva kao dva odvojena polja istraživanja. Ovaj rad bavi se obradom podataka i otkrivanjem varijanti unutar populacije mikroorganizama virusa. Koriste se unaprijed pripremljeni skupovi podataka dobiveni sekvenciranjem genoma nad kojima se vrši pročišćavanje i obrada podataka kako bi se naposljetku izračunala Shannonova entropija i Nukleotidna raznolikost. Rezultati obrade podataka i izračuni Shannonove entropije i Nukleotidne raznolikosti su grafički vizualizirani kako bi se odredila heterogenost virusne populacije. Heterogenost virusne populacije pobliže naznačava mogućnost stabilnih mutacija virusa, što može utjecati na učinkovitost postojećih cjepiva. Rad pojašnjava kako je moguće iz velikog i ljudima nepreglednog skupa podataka dobiti vrijedne informacije o mutacijama unutar populacije virusa. Pomoću tehnike objašnjene u radu moguće je obraditi bilo koji skup podataka i izvući zaključke prilikom istraživanja virusa.
Ključne riječi
obrada podataka; pročišćavanje podataka; virusi; Shannonova entropija; nukleotidna raznolikost