correzione dello splitter per nuovo file di configurazione
This commit is contained in:
@@ -139,11 +139,11 @@ class bananaSPLITTER(QThread):
|
|||||||
except:
|
except:
|
||||||
pass #non segnalare eccezione se il parse fallisce
|
pass #non segnalare eccezione se il parse fallisce
|
||||||
# ricerco la data
|
# ricerco la data
|
||||||
if (lineWords[self.settings['monthPosition']]).capitalize() in self.docStruct['dateWords']:
|
if (lineWords[self.settings['monthPosition']]).capitalize() in self.docStruct['language']['dateWords']:
|
||||||
try:
|
try:
|
||||||
docDate=parse.parse(self.docStruct['dateFormat'],l).named
|
docDate=parse.parse(self.docStruct['dateFormat'],l).named
|
||||||
docDate['month']=docDate['month'].lstrip().rstrip().capitalize()
|
docDate['month']=docDate['month'].lstrip().rstrip().capitalize()
|
||||||
docDate['month']=self.docStruct['dateWords'].index(docDate['month'])+1
|
docDate['month']=self.docStruct['language']['dateWords'].index(docDate['month'])+1
|
||||||
title = ''
|
title = ''
|
||||||
titleBegin=True
|
titleBegin=True
|
||||||
# dopo la data inizia il titolo, ma prima si cerca il nome del giornale
|
# dopo la data inizia il titolo, ma prima si cerca il nome del giornale
|
||||||
@@ -161,7 +161,7 @@ class bananaSPLITTER(QThread):
|
|||||||
except:
|
except:
|
||||||
self.log.warn("Ho trovato una riga ambigua.. potrebbe essere una data ma non so: [{}]". format(l.strip('\r\n')))
|
self.log.warn("Ho trovato una riga ambigua.. potrebbe essere una data ma non so: [{}]". format(l.strip('\r\n')))
|
||||||
pass
|
pass
|
||||||
elif lineWords[0] in self.docStruct['headWords']:
|
elif lineWords[0] in self.docStruct['language']['headWords']:
|
||||||
#cambio stato e inizializzo un nuovo documento da riempire
|
#cambio stato e inizializzo un nuovo documento da riempire
|
||||||
self.status = 'head'
|
self.status = 'head'
|
||||||
newDoc=dict()
|
newDoc=dict()
|
||||||
@@ -177,12 +177,12 @@ class bananaSPLITTER(QThread):
|
|||||||
pass
|
pass
|
||||||
elif self.status == 'head':
|
elif self.status == 'head':
|
||||||
tempContent = list()
|
tempContent = list()
|
||||||
if lineWords[0] not in self.docStruct['headWords']: #se la prima parola non e' tra quelle di inizio
|
if lineWords[0] not in self.docStruct['language']['headWords']: #se la prima parola non e' tra quelle di inizio
|
||||||
tempBody.append(l) # vuol dire che ho trovato l'articolo e aggiungo la prima riga al contenuto del documento
|
tempBody.append(l) # vuol dire che ho trovato l'articolo e aggiungo la prima riga al contenuto del documento
|
||||||
self.status = 'body'
|
self.status = 'body'
|
||||||
pass
|
pass
|
||||||
elif self.status == 'body':
|
elif self.status == 'body':
|
||||||
if not lineWords[0] in self.docStruct['tailWords']: #se la prima parola non e' tra quelle di fine
|
if not lineWords[0] in self.docStruct['language']['tailWords']: #se la prima parola non e' tra quelle di fine
|
||||||
if self.settings['delLF']:
|
if self.settings['delLF']:
|
||||||
tempBody.append(l.strip('\n')) #allora sto leggendo l'articolo
|
tempBody.append(l.strip('\n')) #allora sto leggendo l'articolo
|
||||||
else:
|
else:
|
||||||
|
|||||||
Reference in New Issue
Block a user