Clasificación de opiniones provenientes de la web considerando el uso de información de tipo personal
Resumen
Los engaños han estado en la sociedad desde hace tiempo y han llegado a converger más, debido a las capacidades tecnológicas que actualmente tienen los dispositivos y el uso generalizado de la web que hacemos. Esta situación ha ocasionado muchos efectos negativos, como la desinformación entre usuarios, afectando la perspectiva o pensamiento ante actividades cotidianas. Recientemente, se han realizado diversas investigaciones se han propuesto para detectar engaños en publicaciones en línea. Este trabajo propone contemplar un elemento importante para apoyar la detección de engaños: explorar los pronombres personales en las publicaciones (u opiniones), ya que su uso tiende a mostrar honestidad entre las personas. La metodología propuesta separa las opiniones en oraciones que usan pronombres personales, para analizar su valor en la tarea. Se utilizan dos conjuntos de opiniones para evaluar la propuesta: Op Spam y Amazon. Los resultados son alentadores, dado que muestran que los pronombres personales son relevantes para identificar esta tarea.
Descargas
Citas
Ahmed, H., Traore, I., and Saad, S. (2018). Detecting opinion spams and fake news using text classi cation. Security and Privacy, 1(1):e9.
Altunbey Ozbay, F. and Alatas, B. (2020). Fake news detection within online social media using supervised arti cial intelligence algorithms. Physica A: Statistical Mechanics and its Applications.
Buller, D. B. and Burgoon, J. K. (1996). Interpersonal deception theory. Communication Theory, pages 203 –242.
Cabrejas, C., Marti, J. V., Pajares, A., and V., S. (2019). Deception detection in arabic texts using n-grams text mining. In FIRE (Working Notes).
Fuller, M. C., Biros, P. D., and Delen, D. (2011). An investigation of data and text mining methods for real world deception detection. Expert Systems with Applications, 38:8392–8398.
Fuller, M. C., Biros, P. D., and Delen, D. (2014). Automated deception detection of 911 call transcripts. Security informatics, 8(7).
G., D. B. (2007). Deception detection expertise. American Psychology-Law Society, pages 339 – 351.
Gelbukh, A. (2010). Procesamiento de lenguaje natural y sus aplicaciones. komputer. Pattern recognition and information forensics, pages 6 – 11.
Holland, D. and Quinn, N. (1995). Cultural models in language and thougth. Cambridge University Press.
Krishnamurthy, G., Majumder, N., Poria, S., and Cambria, E. (2018). A deep learning approach form multimodal deception detection. arXiv preprint ar- Xiv:1803.00344.
Mbaziira, A. and Jones, J. (2016). A text-based deception detection model for cybercrime. In Int. Conf. Technol. Manag, pages 1–8.
Newman, L. M., Pennebaker, J. W., Berry, D. S., and Richards, J. M. (2003). Lying words: Predicting deception from linguistic styles. PSPB, 29.
Ortega Mendoza, R. M., Hernández Farías, D. I., Montes y Gómez, M., and Villaseñor Pineda, L. (2022). Revealing traces of depression through personal statements analysis in social media. Artificial Intelligence in Medicine, 123:102202.
Ortega Mendoza, R. M., López Monroy, A. P., Franco Arcega, A., and Montes y Gómez, M. (2018). Peimex at erisk2018: Emphasizing personal information for depression and anorexia detection. In CLEF (Working Notes).
Ortega Mendoza, R. M., Villaseñor Pineda, L., and Montes y Gómez, M. (2007). Using lexical patterns for extracting hyponyms from the web. In Mexican International Conference on Artificial Intelligence, pages 904–911. Springer.
Ott, M., Cardie, C., and Hancock, J. (2013). Negative deceptive opinion spam.
NAACL HLT 2013 - 2013 Conference of the North American chapter of the association for computational linguistics: Human language technologies, proceedings of the main conference, pages 497–501.
Rill García, R., Villaseñor Pineda, L., Reyes Meza, V., and Escalante, H.(2019). From text to speech: A multimodal cross-domain approach for deception detection. Lecture notes in computer science (including subseries lecture notes in artificial intelligence and lecture notes in bioinformatics), pages 164–177.
Ruiz, W. (2006). Técnicas de minería de datos aplicadas en la detección de fraude. pages 1 – 9.
Sánchez Junquera, J., Villaseñor Pineda, L., Escalante, H., Montes, and Gómez, M. (2017). Detección del engaño en notas de opinión a través de técnicas tradicionales de clasificación automática de textos. Res. Comput. Sci., 134:141–150.
Song, F., Liu, S., and Yang, J. (2005). A comparative study on text representation schemes in text categorization. Pattern analysis and applications, 8:199–209.
Wanumen Silva, L. F. (2010). Miner ́ıa de datos para la predicción de fraudes en tarjetas de crédito. pages 44 – 57.
Zuckerman, M., DePaulo, B. M., and Rosenthal, R. (1981). Verbal and non verbal communication of deception. Advances in experimental social psychology, 14.