Minería de patrones frecuentes para la comprobación de las reglas de Susumu Ohno y su uso en la identificación de evolución de organismos biológicos
Resumen
Con el desarrollo de la bioinformática, la búsqueda de patrones frecuentes en secuencias de ADN se ha vuelto un punto de atención crítico. Los patrones de secuencia biológicos, especialmente patrones que se repiten, usualmente reflejan alguna característica funcional o estructural importante. Como resultado de varios estudios, Susumu Ohno propuso una serie de reglas que las secuencias de ADN deben cumplir para la propia evolución de esos organismos biológicos. El presente trabajo realizó una validación de dichas reglas basándose en técnicas de minería de datos y cadenas de Markov evaluando 32,074 secuencias de ADN de diversos organismos biológicos obtenidos de la base de datos biológica del repositorio GenBank, perteneciente al Centro Nacional de Información de Bioinformática del departamento de salud de Estados Unidos, y con lo cual se pudo identificar organismos que poseen particularidades que pueden diferenciarlos en su evolución.
Descargas
Citas
Aggarwal, C. C., Han, J., 2014. Frequent pattern mining. Springer.
Agrawal, R., Imielinski, T., Swami, A., 1993. Mining association rules between sets of items in large databases. In: Acm sigmod record. Vol. 22. ACM, pp. 207–216.
Calvo, A., 2015. Biología celular biomédica + StudentConsult en español. Elsevier, Barcelona.
Campbell, N., Urry, L. A., Cain, M. L., Wasserman, S. A., Minorsky, P. V., Jackson, R. B., Reece, J. B., 2014. Campbell biology. Pearson, Boston.
Crick, F., 1958. On protein synthesis. In: Symposium of the Society for Experimental Biology XII. New York: Academic Press.
Hall, B. K., 2003. Unlocking the black box between genotype and phenotype: Cell condensations as morphogenetic (modular) units. Biology and Philosophy 18 (2), 219–247.
Hossain, K. S. M. T., Patnaik, D., Laxman, S., Jain, P., Bailey-Kellogg, C., Ramakrishnan, N., Sept 2013. Improved multiple sequence alignments using coupled pattern mining. IEEE/ACM Transactions on Computational Biology and Bioinformatics 10 (5), 1098–1112. DOI: 10.1109/TCBB.2013.36
Junyan, Z., Chenhui, Y., 2015. Sequence pattern mining based on markov chain. In: Information Technology in Medicine and Education (ITME), 2015 7th International Conference on. IEEE, pp. 234–238.
Kumar, V., Sharma, A., Kaur, R., Thukral, A. K., Bhardwaj, R., Ahmad, P., 2017. Differential distribution of amino acids in plants. Amino Acids 49, 821–869.
Liu, X., Wu, J., Gong, H., Deng, S., He, Z., Sept 2014. Mining conditional phosphorylation motifs. IEEE/ACM Transactions on Computational Biology and Bioinformatics 11 (5), 915–927. DOI: 10.1109/TCBB.2014.2321400
Medeiros, I., Neves, N., Correia, M., March 2016. Detecting and removing web application vulnerabilities with static analysis and data mining. IEEE Transactions on Reliability 65 (1), 54–69. DOI: 10.1109/TR.2015.2457411
Mutakabbir, K. M., Mahin, S. S., Hasan, M. A., 2014. Mining frequent pattern within a genetic sequence using unique pattern indexing and mapping techniques. In: Informatics, Electronics & Vision (ICIEV), 2014 International Conference on. IEEE, pp. 1–5.
National Center of Biotechnology Information, 11 2017. Gen bank and wgs statistics. consultado el 15-04-2019 desde https://www.ncbi.nlm.nih.gov/genbank/.
Ohno, S., 1988. Universal rule for coding sequence construction: Ta/cg deficiency-tg/ct excess. Proceedings of the National Academy of Sciences 85 (24), 9630–9634.
Osawa, S., Honjo, T., 8 2015. Evolution of Life. Fossils, Molecules, and Culture. Springer-Verlag. DOI: 10.1046/j.1420-9101.1992.5040725.x
Tahir, M., Hayat, M., Kabir, M., 2017. Sequence based predictor for discrimination of enhancer and their types by applying general form of chou’s trinucleotide composition. Computer Methods and Programs in Biomedicine 146, 69 – 75. DOI: https://doi.org/10.1016/j.cmpb.2017.05.008
Derechos de autor 2019 Luis H.| García-Islas, Anilu Franco-Arcega, Antonio Quiroz-Gutierrez, Kristell D. Franco-Sanchez
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial-SinObrasDerivadas 4.0.