Utente:AushulzBot/Python

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Regex e script pronti all'uso[modifica | modifica wikitesto]

Le regex che sono scritte in questa sezione ("regex del mio bot") se sono state scritte da me autorizzo chiunque ad utilizzarle come meglio crede, se invece sono scritte da altri, le utilizzo in quanto gli utenti che le hanno create ne hanno permesso l'utilizzo.

Nelle sottopagine di Utente:AushulzBot/Python si trovano gli script e le regex in python che vado mano a mano scrivendo o che prendo in prestito da altri utenti.

  • Utente:AushulzBot/Python/1 - Formattazione wiki delle note: al momento riesco a modificare i titoli della sezione "Note" quando sono errati. In futuro scriverò uno script per effettuare molte altre correzioni che riguardano le convenzioni dettate da Wikipedia:Modello di voce.
  • Utente:AushulzBot/Python/2 - Errori di ortografia nei nomi delle regioni: si tratta di inserire un trattino "-" in alcuni nomi di regioni italiane. Necessito il flagaggio del bot per completare le operazioni, piuttosto ripetitive.
  • Utente:AushulzBot/Python/3 - Sostituzioni SI (Sistema Internazionale): sto mettendo insieme un po' di regex mie e di altri. Bisogna stabilire con il Progetto:Scienza e tecnica le linee guida prima di far partire il bot, anche se alcune correzioni mano mano vengono svolte da altri bot.
  • Utente:AushulzBot/Python/4, Utente:AushulzBot/Python/7 e Python:Portalebot.py - Modifiche al template:Portale: è indispensabile avere il flag per iniziare questi lavori, che vanno a sistemare il template:portale in vari modi (lascio i sottoportali, unisco i template:portale, inserisco i template:portale per categoria). Non sono riuscito a fare partire la regex dei sottoportali con il dump, ma in alfabetico funziona benissimo (sono arrivato dopo la "L" per la regex "Campania", ma ci sono tantissime regex da fare girare, per cui è molto meglio se risolvo il problema del dump).
  • Utente:AushulzBot/Python/5 - Sostituzioni wiki en-it: sono sostituzioni di termini che derivano dal codice wiki inglese, ad esempio "[[category:" al posto di "[[categoria:"
  • Utente:AushulzBot/Python/6 - Correzione minuscole: script che inserisce l'iniziale maiuscola nei nomi proprio di persona, nomi geografici, e dove ce n'è bisogno. Qualunque aiuto a completare la lista è ben accetto.
  • Utente:AushulzBot/Python/8 - Sostituzioni template deprecati: sono sostituzioni di template deprecati (ad esempio Template:Commonscat).
  • Ordine delle sezioni predefinite:
replace.py -page:"Utente:AushulzBot/Sandbox" -regex "(=+ *Bibliografia *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" "(=+ *Voci correlate *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2"  "(=+ *Altri progetti *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" "(=+ *Collegamenti esterni *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" -summary:"Ordino [[Wikipedia:Sezioni#Sezioni_predefinite|sezioni predefinite]]"
replace.py -page:"Utente:AushulzBot/Sandbox" -regex "(=+ *Altri progetti *=+)((\s|\S)*)(?<=\n)(=+ *Voci correlate *=+ *(\s*\* *\[\[[a-zA-Z0-9 ]+\]\])+)\s*" "\4\3\3\1\2" "(=+ *Collegamenti esterni *=+)((\s|\S)*)(?<=\n)(=+ *Voci correlate *=+ *(\s*\* *\[\[[a-zA-Z0-9 ]+\]\])+)\s*" "\4\3\3\1\2" -summary:"Ordino [[Wikipedia:Sezioni#Sezioni_predefinite|sezioni predefinite]]"
Casi in cui ha fallito: [1] (Sottosezioni), [2] (altre sezioni inserite in fondo, tra quelle predefinite), [3] (manca l'elenco puntato), [4] (template spezzato con "invio"), [5] (testo nascosto)