Algoritmo de compresión y descompresión de secuencias de ADN para su uso en traducción de proteínas

Luis H. García-Islas; Anilu  Franco-Árcega; Kristell D. Fránco-Sánchez

doi:10.29057/icbi.v9i17.6450

Autores/as

Luis H. García-Islas Universidad Autónoma del Estado de Hidalgo https://orcid.org/0000-0002-1483-2428
Anilu Franco-Árcega Universidad Autónoma del Estado de Hidalgo https://orcid.org/0000-0002-9415-8313
Kristell D. Fránco-Sánchez Universidad Autónoma del Estado de Hidalgo https://orcid.org/0000-0001-7916-9439

DOI:

https://doi.org/10.29057/icbi.v9i17.6450

Palabras clave:

Minería de Datos, Compresión de datos, ADN, Bioinformática

Resumen

La Bioinformática es una disciplina que se establece como soporte para la Biología Molecular y el estudio de genes. Es un enfoque que implementa distintas técnicas computacionales sobre datos biológicos con el objetivo de extraer información útil, para probar conocimientos existentes o incluso para crear nuevos. Sin embargo, debido a la enorme cantidad de datos y el espacio en disco, el procesamiento se vuelve complejo. Una forma de simplificar el proceso de secuencias de genes es por medio de compresión y descompresión de datos. En este artículo se propone un algoritmo que reduce el tamaño de las secuencias, sin perder información, y por lo tanto reduce la complejidad de procesamiento.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Bayat, A., (2002). Science, medicine, and the future: Bioinformatics. BMJ (Clinical research ed.) 324, 1018–1022.

Behzadi, B., Le Fessant, F., (2005). Dna compression challenge revisited: A dynamic programming approach. In: Apostolico, A., Crochemore, M., Park, K.(Eds.), Combinatorial Pattern Matching. Springer Berlin Heidelberg, Berlin,Heidelberg, pp. 190–200.

Bishop, O. T. (2014). Bioinformatics and Data Analysis in Microbiology. CaisterAcademic Press.

Calvo, A. (2015). Biología celular biomédica + StudentConsult en español. Elsevier, Barcelona.

Crick, F., (1958). On protein synthesis. In: Symposium of the Society for Expe-rimental Biology XII. New York: Academic Press.

Grumbach, S., Tahi, F. (1994). A New Challenge for Compression Algorithms:Genetic Sequences. Information processing & management 30.URL:https://hal.inria.fr/inria-00180949

Hall, B. K. (2003). Unlocking the black box between genotype and phenotype:Cell condensations as morphogenetic (modular) units. Biology and Philo-sophy 18 (2), 219–247.

Jahaan, A., Ravi, T., Panneer Arokiaraj, S. (2017). A comparative study andsurvey on existing dna compression techniques. International Journal of Ad-vanced Research in Computer Science 8 (3).

Kryukov, K., Ueda, M. T., Nakagawa, S., Imanishi, T., (2019). NucleotideArchival Format (NAF) enables efficient lossless reference-free compressionof DNA sequences. Bioinformatics 35 (19), 3826–3828. URL:https://doi.org/10.1093/bioinformatics/btz144DOI:10.1093/bioinformatics/btz144

Mansouri, D., Yuan, X. (2018). One-bit dna compression algorithm. In: Cheng,L., Leung, A. C. S., Ozawa, S. (Eds.), Neural Information Processing. Sprin-ger International Publishing, Cham, pp. 378–386.

National Center of Biotechnology Information (2017). Gen-bank and wgs statistics. Consultadoel 15-08-2020 desde https://www.ncbi.nlm.nih.gov/genbank/.

Pratas, D., Pinho, A. J. (2011). Compressing the human genome using exclusively markov models. In: Rocha, M. P., Rodríguez, J. M. C., Fdez-Riverola,F., Valencia, A. (Eds.), 5th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2011). SpringerBerlin Heidelberg, Berlin, Heidelberg, pp. 213–220.

Saada, B., Zhang, J. (2015). Vertical dna sequences compression algorithm basedon hexadecimal representation. In: Proceedings of the World Congress onEngineering and Computer Science. Vol. 2.

Venugopal, K. R., Srinivasa, K. G., Patnaik, L. M. ( 2009). Probabilistic Approach for DNA Compression. Springer Berlin Heidelberg, Berlin, Heidel-berg, pp. 279–289. URL:https://doi.org/10.1007/978-3-642-00193-214