Descripció

Cada mostra del corpus inclou una imatge escanejada del document original, acompanyada de la seva transcripció. En aquells casos en què l’ortografia s’allunya de la norma actual, també es proporciona una transcripció modernitzada, elaborada segons les normes generals vigents d’escriptura de l’espanyol, així com una edició crítica, que consisteix en la comparació entre la transcripció original i la modernitzada.

A cada mostra del corpus se li ha assignat un codi únic que permet identificar-la segons diversos criteris:

  • l’idioma (ES = espanyol);
  • el tipus  de text (CHIS = acudits;ANEC = anècdotes; EPIG = epigrama; ENTR = entremès;RELA = relat;CUEN = conte; NARR = narració breu; CRON = crònica; NOTI = notícia; OBIT = obituari; ESQU = esquela);
  • el format ( 1 = text; 2 = vinyeta; 3 = tira còmica; 0 = altres);
  • el mitjà de publicació (1 = diari; 2 = revista; 3 = fullet; 4 = fascicle; 5 = fanzín; 6 = almanaque; 7 = llibre; 0 = altres);
  • el lloc d’edició (MAD = Madrid; VAL = València; etc.);
  • i el número d’identificació dins del corpus.

Per ejemple, el codi 00370_ES_CHIS23_MAD correspon a la mostra número 370 de Humtext, classificada com un acudit en format de vinyeta  (2) publicat en un diari ( (3), editat a Madrid.