Show simple item record

dc.contributor.authorAlmeida-Cruz, Yudivián
dc.contributor.authorEstévez-Velarde, Suilan
dc.contributor.authorPiad-Morffis, Alejandro
dc.date.accessioned2016-09-20T10:22:07Z
dc.date.available2016-09-20T10:22:07Z
dc.date.issued2014
dc.identifier.citationGECONTEC: Revista Internacional de Gestión del Conocimiento y la Tecnología
dc.identifier.issn2255-5684
dc.identifier.urihttp://hdl.handle.net/10433/2760
dc.description.abstractResumenEl trabajo presenta una alternativa para identificar idiomas en Twitter sin que sea necesario utilizar conjuntos de entrenamiento o información agregada. En dicha alternativa se utilizan técnicas basadas en los algoritmos de reconocimiento de trigramas y small words. Se valora la utilización de estos algoritmos por sí solos y en un modelo de composición. Asimismo, se analiza la incidencia del pre-procesamiento de los tweets en la precisión de la identificación de los idiomas. Finalmente, después de un proceso de experimentación, se determina la mejor alternativa de las estudiadas.AbstractThe paper presents an alternative to identify languages on Twitter without having to use training sets or aggregated information. Such alternative is based on trigram recognition algorithms and small words techniques. The use of these algorithms is evaluated both on their own and in a model of composition. Also, the incidence of pre-processing of tweets in the accuracy of identifying the language is discussed. Finally, after a process of experimentation, the best alternative, out of those studied, is determined.
dc.language.isoes
dc.publisherUniversidad Pablo de Olavide
dc.relation.publisherversionhttp://www.upo.es/revistas/index.php/gecontec/article/view/1081
dc.rightsCopyright (c) 2014 GECONTEC: Revista Internacional de Gestión del Conocimiento y la Tecnología
dc.subjectDetección de Idiomas
dc.subjectn-gramas
dc.subjecttrigramas
dc.subjectsmall words
dc.subjectTwitter
dc.subjectLanguage detection
dc.subjectn-grams
dc.subjecttrigrams
dc.subjectsmall words
dc.subjectTwitter
dc.titleDetección de Idioma en Twitter (Language Detection on Twitter)
dc.description.versionArtículo revisado por pares


Files in this item

This item appears in the following Collection(s)

Show simple item record