correzione dello splitter per nuovo file di configurazione

This commit is contained in:
2020-03-25 11:08:16 +01:00
parent 62f9dbe598
commit 4351e10984

View File

@@ -139,11 +139,11 @@ class bananaSPLITTER(QThread):
except: except:
pass #non segnalare eccezione se il parse fallisce pass #non segnalare eccezione se il parse fallisce
# ricerco la data # ricerco la data
if (lineWords[self.settings['monthPosition']]).capitalize() in self.docStruct['dateWords']: if (lineWords[self.settings['monthPosition']]).capitalize() in self.docStruct['language']['dateWords']:
try: try:
docDate=parse.parse(self.docStruct['dateFormat'],l).named docDate=parse.parse(self.docStruct['dateFormat'],l).named
docDate['month']=docDate['month'].lstrip().rstrip().capitalize() docDate['month']=docDate['month'].lstrip().rstrip().capitalize()
docDate['month']=self.docStruct['dateWords'].index(docDate['month'])+1 docDate['month']=self.docStruct['language']['dateWords'].index(docDate['month'])+1
title = '' title = ''
titleBegin=True titleBegin=True
# dopo la data inizia il titolo, ma prima si cerca il nome del giornale # dopo la data inizia il titolo, ma prima si cerca il nome del giornale
@@ -161,7 +161,7 @@ class bananaSPLITTER(QThread):
except: except:
self.log.warn("Ho trovato una riga ambigua.. potrebbe essere una data ma non so: [{}]". format(l.strip('\r\n'))) self.log.warn("Ho trovato una riga ambigua.. potrebbe essere una data ma non so: [{}]". format(l.strip('\r\n')))
pass pass
elif lineWords[0] in self.docStruct['headWords']: elif lineWords[0] in self.docStruct['language']['headWords']:
#cambio stato e inizializzo un nuovo documento da riempire #cambio stato e inizializzo un nuovo documento da riempire
self.status = 'head' self.status = 'head'
newDoc=dict() newDoc=dict()
@@ -177,12 +177,12 @@ class bananaSPLITTER(QThread):
pass pass
elif self.status == 'head': elif self.status == 'head':
tempContent = list() tempContent = list()
if lineWords[0] not in self.docStruct['headWords']: #se la prima parola non e' tra quelle di inizio if lineWords[0] not in self.docStruct['language']['headWords']: #se la prima parola non e' tra quelle di inizio
tempBody.append(l) # vuol dire che ho trovato l'articolo e aggiungo la prima riga al contenuto del documento tempBody.append(l) # vuol dire che ho trovato l'articolo e aggiungo la prima riga al contenuto del documento
self.status = 'body' self.status = 'body'
pass pass
elif self.status == 'body': elif self.status == 'body':
if not lineWords[0] in self.docStruct['tailWords']: #se la prima parola non e' tra quelle di fine if not lineWords[0] in self.docStruct['language']['tailWords']: #se la prima parola non e' tra quelle di fine
if self.settings['delLF']: if self.settings['delLF']:
tempBody.append(l.strip('\n')) #allora sto leggendo l'articolo tempBody.append(l.strip('\n')) #allora sto leggendo l'articolo
else: else: