{rfName}
Te

Altmetrics

Compartir

30 d’octubre de 2024
Publicacions
>
Conferència publicada
No

Textual-Content-Based Classification of Bundles of Untranscribed Manuscript Images

Publicat a: Proceedings - International Conference on Pattern Recognition. 3162-3169 - 2021-01-01 (), DOI: 10.1109/ICPR48806.2021.9412688

Autors:

Prieto, JR; Bosch, V; Vidal, E; Alonso, C; Orcero, MC; Marquez, L
[+]

Afiliacions

Inst Andaluz Patrimonio Hist, Ctr Arqueol Sunacuat - Autor o coautor
Univ Politecn Valencia, PRHLT Res Ctr - Autor o coautor

Resum

Content-based classification of manuscripts is an important task that is generally performed in archives and libraries by experts with a wealth of knowledge on the manuscript's contents. Unfortunately, many manuscript collections are so vast that it is not feasible to rely solely on experts to perform this task. Current approaches for textual-content-based manuscript classification generally require the handwritten images to be first transcribed into text - but achieving sufficiently accurate transcripts are generally unfeasible for large sets of historical manuscripts. We propose a new approach to perform automatically this classification task which does not rely on any explicit i mage transcripts. It is based on probabilistic indexing, a relatively novel technology which allows to effectively represent the intrinsic word-level uncertainty generally exhibited by handwritten text images. We assess the performance of this approach on a large collection of complex manuscripts from the Spanish Archivo General de Indias, with promising results. To the best of our knowledge, this is the first published work proposing, developing and assessing a successful approach for content-based classification of untranscribed manuscript images.
[+]

Paraules clau

Classification tasksContent-based classificationConvolutional neural-networksExtractionHandwritten imagesHandwritten textsImage classificationNew approachesText processingTextual contentWord level

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista Proceedings - International Conference on Pattern Recognition a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència Scopus (SJR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2021, es trobava a la posició , aconseguint així situar-se com a revista Q2 (Segundo Cuartil), en la categoria Computer Vision and Pattern Recognition.

Independentment de l'impacte esperat determinat pel canal de difusió, és important destacar l'impacte real observat de la pròpia aportació.

Segons les diferents agències d'indexació, el nombre de citacions acumulades per aquesta publicació fins a la data 2026-04-03:

  • WoS: 5
  • Scopus: 9
[+]

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2026-04-03:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 4 (PlumX).
[+]

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (Prieto, JR) .

l'autor responsable d'establir les tasques de correspondència ha estat Prieto, JR.

[+]