Seleziona una pagina

Come molti altri sono un grande appassionato di tutto il mondo retro, mi piacciono infatti i vecchi computer e le vecchie console, provare e sperimentare giochi, applicazioni e “cose” che arrivano direttamente da quella che possiamo definire la preistoria dell’informatica.

L’esigenza: spesso capita di dover scaricare moltissimi file, come ad esempio compilation di manualistica, schede tecniche, .pdf di riviste, roms e molto altro, molti file dicevamo, magari di piccole dimensioni e procedere a farlo manualmente può rivelarsi a dir poco un compito noioso, ecco che allora potrebbe venirci in aiuto una fantastica applicazione opensource, potentissima e versatile: wGet. WGet è un software potentissimo che ci permette di organizzare ed automatizzare il download di file su differenti protocolli, potente si, ma anche complesso da utilizzare a tratti.

la documentazione su wGet non manca e a questo link potrete trovare, oltre a maggiori informazioni di carattere generale, anche il manuale di riferimento.

io per questa breve guida ho utilizzato wGet su linux, ma lo potrete scaricare ed utilizzare anche su Windows, potete ad esempio scaricarlo da quì. Dovreste poi poterlo utilizzare nello stesso modo.

Vediamo come scaricare più file contemporaneamente da Archive.org e perché potrebbe essere necessario procedere in questo modo in alternativa ai link torrent o alla pacchettizzazione automatica in archivi .zip.

Prendiamo come esempio volessimo scaricare il romset di giochi per NES, potremmo trovarci di fronte ad un archivio con troppi file al suo interno e quindi non sarebbe possibile generarlo lato Archive.org, ci verrebbe restituito un errore “…troppi file…”, la stessa accade per i link torrent spesso gli archivi sono troppo estesi e all’interno non sono contenuti/indicizzati tutti i file per il download. A questo punto può aiutarci wGet.

imges001

Va da se che ho scelto questo esempio solo per portare un esempio di file multipli, ovviamente tenete sempre presente che siamo autorizzati al download solo di software di cui possediamo copia originale licenziata.

portiamoci o nel caso creiamo una cartella che poi dovrà contenere i file scaricati, all’interno di questa cartella creiamo un file di testo denominato, per ns. convenzione: itemlist.txt all’interno di questo file di testo andremo ad inserire l’ultima parte dell’indirizzo (url), che troviamo della barra dell’indirizzo del ns. browser:

imges002

nel nostro caso il file itemlist.txt dovrà contenere: nes-romset-ultra-us non dovranno esserci spazi o altri caratteri, salviamo e ok, possiamo uscire.

Adesso possiamo lanciare wGet con la lunga stringa di seguito e che cercheremo di capire nelle numerose istruzioni che vengono fornite:

wget -r -H -nc -np -nH –cut-dirs=3 -A .zip -e robots=off -l1 -i ./itemlist.txt –B ‘http://archive.org/download/’


-r il download dovrà essere ricorsivo per tutte le directory/file

-H sposta su hosti differenti se collegati quando necessario.

-nc non verranno sovrascritti i file già presenti, magari scaricati in una precedente sessione

-nH non verrano ricreate le cartelle come indicate eventualmente nella gerarchia dell’host remoto

–cut—dirs=3 verrà saltato un numero preciso di directory/sub directory

-A si procederà a prelevare file con le estensioni specifiche .zip, .pdf, .rar etc etc…

-e esegue un comando/sub comando, nel nostro caso specifico robots=off

-l1 numero massimo di ricursione, se indichiamo 0 corrisponde ad infinito

-i indica il file dal quale leggere la lista nel nostro caso ./itemlist.txt

-B l’indirizzo di riferimento tra apici ‘http://tutto-quello-che-leggi-prima-di-quello-che-sta-nel-testo-in-itemlist/’