Ennece chiàcchiera:A la fónte - La scuncòrdie.djvu

Contenuti della pagina non supportati in altre lingue.
'A Wikisource.

memoRegex[cagna]

{ " +([\\.,;:!?])":[" +([\\.,;:!?])","$1","g"], "’’":["’’","’ ’","g"], "([^aeoui]’) ([eaiouéèàìùh])":["([^aeoui]’) ([eaiouéèàìùh])","$1$2","gi"], "”":["”","’ ’","g"],"1’":["1’","l’","g"], "eh’":["eh’","ch’","g"], "11’":["11’","ll’","g"], "ccb":["ccb","cch","g"], "^r (\\d+)$":["^r (\\d+)$","{{Rh||— $1 —|}}[[Category:A la fónte]]","gm"] }

Schemi Rh[cagna]

<inizio>2	198	{{Rh||— 999 —|}}	{{Rh||— 999 —|}}
<fine>

Le pagine mancanti[cagna]

@Alex brollo:...Forse si trovano nella versione anteriore su commons, controllo e riparo. --C.R. (talk) 20:17, 30 August 2015 (UTC)

@C.R.: Non ricaricare il djvu.... se no mi mangi l'OCR; mandami piuttosto il file su dropbox. Non c'è poi quella gran fretta.... :-) --Alex brollo (talk) 20:25, 30 August 2015 (UTC)
domanda @Alex brollo:, in generale preferisci djvu o pdf??--C.R. (talk) 20:33, 30 August 2015 (UTC)
voglio dire quando aggiungi l'OCR layer... sorry--C.R. (talk) 20:35, 30 August 2015 (UTC)
In questo caso, quando ci sono pagine da aggiungere, meglio il djvu (quello che avresti ricaricato in Commons); in generale, sia per IA che per FineReader, meglio il pdf. I djvu allestiti dal tuo pdf2djvu o-come-si-chiama sono molto, molto migliori di quelli prodotti da FineReader. --Alex brollo (talk) 20:41, 30 August 2015 (UTC)
Fatto Fatto, ma è venuto un po' pesantino...--C.R. (talk) 06:09, 31 August 2015 (UTC)
@C.R.: Che peccato che nella "storia" di nap.source non ci sia stato, fin dall'inizio, un dissodamento della questione OCR e dei suoi requisiti, in relazione con lo strato testo dei file djvu.... purtroppo sia io che User:Xavier121, appassionati dell'argomento, siamo windowsiani e non linuxiani, e le applicazioni più utili (FineReader, DjvuToy) sono windowscentriche. Unico punto di contatto, la libreria DjvuLibre, che esiste anche in versione linux. --Alex brollo (talk) 06:30, 31 August 2015 (UTC)
@Alex brollo: ... :) vabbuò il futuro lo scriviamo noi... ho allestito una raspberry col pdf2djvu... stasera creo una cartella tipo pdf2djvu300dpi addò la raspberry ascolterà, sparagnammo elettricità... Eco-friendly nap wikisource ... poi forse faccio le prove (ho codice vecchio co' tesseract ma venevano assai malamente)--C.R. (talk) 08:01, 31 August 2015 (UTC)
Il problema con l'OCR (che si impara... sbagliando) è che oltre alla risoluzione, ecc, il software è moooolto sensibile alle deformazioni, tesseract in particolare penso pretenda righe assolutamente dritte. Senza un apparato fisso, e un leggio che tenga le pagine piane anche se il libro è spesso, riprodurre una pagina in modo perfetto mediante fotografia è un'impresa; gli scanner ci riescono meglio, ma ci vuole un sacco di tempo in più. Nel futuro di nap.source vedo come necessario innanzitutto un qualche sistema che elimini le deformazioni (a trapezio o a "onda"). Avuta una buona immagine, i programmi OCR ci sono anche per linux; lo stesso tesseract, istruito a dovere, è ottimo. Ricevo in lista wikisource una notizia riguardo il nuovo OCR che funzia in Google Docs, da provare; ma bisogna "alimentarlo", da quanto ho capito, una pagina alla volta. Ti inoltro per mail. --Alex brollo (talk) 09:06, 31 August 2015 (UTC)