Nejste přihlášen/a.

Přihlásit se do poradny

 

V čem hromadně stahovat dokumenty z netu

Od: h4ever® odpovědí: 7 změna:

Zdarvím,

chtěl bych se zeptat jestli existuje nějaká utilita nejlépe pro Firefox nebo Operu, která by z uričtých odkazů, které se mi otevřou na stránce automaticky stáhla všechny pdf dokumenty. Je to roztříděno jakoby do adesářů (pod ikonou adresáře se schovává stránka s dlouhým seznamem odkazů na dokumenty pdf). Takže abych nemusel klikat vždy na daný adresář, jestli je takový program, který dokáže otevřít postupně adresáře/stránky a znich nastahovat všechny ty pdf, ale nejlépe kdyby uměl inteligentně to roztřídit do těch adresářů.

 

 

7 odpovědí na otázku
Řazeno dle hodnocení

 

 

dzordz*
hodnocení

0x

No, wget by to měl zvládnout, snad včetně zachování struktury souborů a složek.

hodnocení

Myslím program pro Windows. Nebo wget jede taky na windowsu a jestli jo tak odkud stáhnout?

dzordz*
hodnocení

nainstalované to sice mám, ale je to dost složité. Jestli s tím umíš mohl by si mi napsat ten příkaz?

Odkaz na stažení je zde.

dzordz*

Vím, jak dostat soubory z adresáře nebo adresářové struktury, když server povolí výpis obsahu :) Což na naprosté většině stránek nejde. Takže druhá možnost, nějak procházet přes hyperlinky, dá se tam nastavit hloubka zanoření, zakázat odkazy mimo danou doménu a stahovat jen soubory s danou příponou. Jenže jak to přesně udělat netuším.

doplněno 13.02.12 17:54:

Tak na hlavní složku mi to nějak nejde, na ty jednotlivé už jo. Třeba pro tu první:

wget.exe -r -A.pdf slv.dk/...

hodnocení

Zajimavé to sice je, ale dělá to samé co downloadthem all. Navíc to tvoje je složitější, jak co do vyvolání příkazu, tak co se týče faktu, že to stáhlo do jednotlivých složek, které jsou očíslované, ale nevím vůbec co v které složce je. Spíš bych potřeboval by se vytvořila složka Ilulissat (BGJN) - > a potom jednotlivé dokumenty měli název tak jak je uveden název dokumentu. To sice není nutnost, ale bylo by to přehlednější. Ten problém je v tom, že stahovat jeden dokument do jedné složky je nesmysl. ... Nějak mi nejde zrušit tučné písmo...

doplněno 13.02.12 18:48: Ale budíž , mohu to doplnit tak aby se nevytvářely ty adresáře.
wget.exe -ndr -A.pdf slv.dk/...
No a tak snad tam je nějaký příkaz na procházení více úrovní.. ještě zkusím projít nápovědu
doplněno 13.02.12 19:44:

Tak jsem to dokázal pomocí wget :) Rekurzivně.

Ale příkaz sem nebudu z bezpečnostních důvodů uvádět kvůli možnosti zneužití.

 

hodnocení

Nenapadá ještě někoho jak přejmenovat stažený soubor? Soubory většinou obsahují něco jako BG_AD_3_BG... a tuto část bych chtěl odstranit. Myslím, že by to snad mohlo jít i v cmd.exe jako samostatný příkaz?

 

 


 

 

 

Přihlásit se k odběru odpovědí z této otázky:

Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.

Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.

Copyright © 2004-2025 Poradna Poradte.cz. Všechna práva vyhrazena. Prohlášení o ochraně osobních údajů. | [tmavý motiv]