Algoritmo de compresión y descompresión de secuencias de ADN para su uso en traducción de proteínas
Resumen
La Bioinformática es una disciplina que se establece como soporte para la Biología Molecular y el estudio de genes. Es un enfoque que implementa distintas técnicas computacionales sobre datos biológicos con el objetivo de extraer información útil, para probar conocimientos existentes o incluso para crear nuevos. Sin embargo, debido a la enorme cantidad de datos y el espacio en disco, el procesamiento se vuelve complejo. Una forma de simplificar el proceso de secuencias de genes es por medio de compresión y descompresión de datos. En este artículo se propone un algoritmo que reduce el tamaño de las secuencias, sin perder información, y por lo tanto reduce la complejidad de procesamiento.
Descargas
Citas
Bayat, A., (2002). Science, medicine, and the future: Bioinformatics. BMJ (Clinical research ed.) 324, 1018–1022.
Behzadi, B., Le Fessant, F., (2005). Dna compression challenge revisited: A dynamic programming approach. In: Apostolico, A., Crochemore, M., Park, K.(Eds.), Combinatorial Pattern Matching. Springer Berlin Heidelberg, Berlin,Heidelberg, pp. 190–200.
Bishop, O. T. (2014). Bioinformatics and Data Analysis in Microbiology. CaisterAcademic Press.
Calvo, A. (2015). Biología celular biomédica + StudentConsult en español. Elsevier, Barcelona.
Crick, F., (1958). On protein synthesis. In: Symposium of the Society for Expe-rimental Biology XII. New York: Academic Press.
Grumbach, S., Tahi, F. (1994). A New Challenge for Compression Algorithms:Genetic Sequences. Information processing & management 30.URL:https://hal.inria.fr/inria-00180949
Hall, B. K. (2003). Unlocking the black box between genotype and phenotype:Cell condensations as morphogenetic (modular) units. Biology and Philo-sophy 18 (2), 219–247.
Jahaan, A., Ravi, T., Panneer Arokiaraj, S. (2017). A comparative study andsurvey on existing dna compression techniques. International Journal of Ad-vanced Research in Computer Science 8 (3).
Kryukov, K., Ueda, M. T., Nakagawa, S., Imanishi, T., (2019). NucleotideArchival Format (NAF) enables efficient lossless reference-free compressionof DNA sequences. Bioinformatics 35 (19), 3826–3828. URL:https://doi.org/10.1093/bioinformatics/btz144DOI:10.1093/bioinformatics/btz144
Mansouri, D., Yuan, X. (2018). One-bit dna compression algorithm. In: Cheng,L., Leung, A. C. S., Ozawa, S. (Eds.), Neural Information Processing. Sprin-ger International Publishing, Cham, pp. 378–386.
National Center of Biotechnology Information (2017). Gen-bank and wgs statistics. Consultadoel 15-08-2020 desde https://www.ncbi.nlm.nih.gov/genbank/.
Pratas, D., Pinho, A. J. (2011). Compressing the human genome using exclusively markov models. In: Rocha, M. P., Rodríguez, J. M. C., Fdez-Riverola,F., Valencia, A. (Eds.), 5th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2011). SpringerBerlin Heidelberg, Berlin, Heidelberg, pp. 213–220.
Saada, B., Zhang, J. (2015). Vertical dna sequences compression algorithm basedon hexadecimal representation. In: Proceedings of the World Congress onEngineering and Computer Science. Vol. 2.
Venugopal, K. R., Srinivasa, K. G., Patnaik, L. M. ( 2009). Probabilistic Approach for DNA Compression. Springer Berlin Heidelberg, Berlin, Heidel-berg, pp. 279–289. URL:https://doi.org/10.1007/978-3-642-00193-214