Detail výsledku

pqsfinder: an exhaustive and imperfection-tolerant search tool for potential quadruplex-forming sequences in R

HON, J.; MARTÍNEK, T.; ZENDULKA, J.; LEXA, M. pqsfinder: an exhaustive and imperfection-tolerant search tool for potential quadruplex-forming sequences in R. BIOINFORMATICS, 2017, vol. 33, no. 21, p. 3373-3379. ISSN: 1367-4803.
Typ
článek v časopise
Jazyk
anglicky
Autoři
Hon Jiří, Ing., Ph.D., UIFS (FIT)
Martínek Tomáš, doc. Ing., Ph.D., UPSY (FIT)
Zendulka Jaroslav, doc. Ing., CSc., UIFS (FIT)
Lexa Matej, Ing., Ph.D.
Abstrakt

Motivation: G-quadruplexes (G4s) are one of the non-B DNA structures easily observedin  vitroandassumed to formin vivo. The latest experiments with G4-specific antibodies and G4-unwinding helicasemutants confirm this conjection.  These four-stranded structures have also been shown to influence arange of molecular processes in cells. As G4s are intensively studied, it is often desirable to screen DNA sequences and pinpoint the precise locations where they might form.
Results: We describe and have tested a newly-developed Bioconductor package for identifying potential quadruplex-forming sequences (PQS). The package is easy-to-use, flexible and customizable. It allows for sequence searches that accommodate possible divergences from the optimal G4 base composition. A novel aspect of our research was the creation and training (parametrization) of an advanced scoring model which resulted in increased precision compared to similar tools. We demonstrate that the algorithm behind the searches has a 96% accuracy on 392 currently known and experimentally observed G4 structures. We also carried out searches against the recent G4-seq data to verify how well we can identify the structures detected by that technology. The correlation with pqsfinder predictions was 0.622, higher than the correlation 0.491 obtained with the second best G4Hunter.

Klíčová slova

G-quadruplex identification, G4, imperfect G4, potential quadruplex-forming sequence, PQS, pattern search

URL
popis doplnění

Softwarový balíček pqsfinder slouží k rychlé identifikaci sekvencí DNA, které pravděpodobně tvoří intramolekulární G-kvadruplex. G-kvadruplexy mají vliv na řadu důležitých molekulárních procesů v buňkách, nejčastěji jako pozitivní či negativní regulátor transkripce, nebo negativní regulátor replikace.

Balíček pqsfinder je unikátní tím, že oproti existujícím řešením umožňuje rychle identifikovat i takové G-kvadruplexy, které se různým způsobem odchylují od základní jednoduché formy G-kvadruplexů. Ze všech existujících nástrojů dosahuje na datové sadě experimentálně ověřených G-kvadruplexů nejvyšší přesnosti 96 % a zároveň vykazuje nejvyšší korelaci se sekvenačními daty zaměřenými na identifikaci všech G-kvadruplexů v lidském genomu. 
Nástroj je dostupný skrze mezinárodní systém Bioconductor, který sdružuje plně dokumentovaný a technicky kvalitní software zaměřený na bioinformatickou analýzu genomických dat. Dále je dostupný skrze uživatelsky jednodušší webové rozhraní na adrese https://pqsfinder.fi.muni.cz.
Od svého zveřejnění v roce 2016 byl pqsfinder každý rok stažen více než 1600 krát (podle veřejně dostupných statistik systému Bioconductor).
Odborný článek popisující princip algoritmu pqsfinder byl dosud citován 12 mezinárodními časopiseckými publikacemi.
V budoucnu může pqsfinder pomoci objevit nové souvislosti mezi G-kvadruplexy v regulačních oblastech genů a některými nemocemi, a tím umožnit rychlejší nalezení nových léčebných postupů.
popis - stručný

Software pqsfinder podporuje výzkum v oblasti buněčných regulačních procesů tím, že přesněji identifikuje oblasti DNA, které mohou tvořit tzv. intramolekulární G-kvadruplexy. G-kvadruplexy ovlivňují regulaci řady důležitých molekulárních procesů v buňkách
V budoucnu tak může pqsfinder pomoci objevit nové souvislosti mezi G-kvadruplexy v regulačních oblastech genů a některými nemocemi, a tím umožnit rychlejší nalezení nových léčebných postupů.
Od svého zveřejnění v roce 2016 byl pqsfinder každý rok stažen více než 1600 krát.
Související odborný článek byl dosud citován 12 mezinárodními časopiseckými publikacemi.

Rok
2017
Strany
3373–3379
Časopis
BIOINFORMATICS, roč. 33, č. 21, ISSN 1367-4803
DOI
UT WoS
000413645800006
EID Scopus
BibTeX
@article{BUT145398,
  author="Jiří {Hon} and Tomáš {Martínek} and Jaroslav {Zendulka} and Matej {Lexa}",
  title="pqsfinder: an exhaustive and imperfection-tolerant search tool for potential quadruplex-forming sequences in R",
  journal="BIOINFORMATICS",
  year="2017",
  volume="33",
  number="21",
  pages="3373--3379",
  doi="10.1093/bioinformatics/btx413",
  issn="1367-4803",
  url="https://academic.oup.com/bioinformatics/article-abstract/33/21/3373/3923794"
}
Soubory
Projekty
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Nástroje, metody a technologie ICT pro podporu konceptu smart cities, VUT, Vnitřní projekty VUT, FIT-S-17-3964, zahájení: 2017-03-01, ukončení: 2020-02-29, ukončen
Pracoviště
Nahoru