Nejste přihlášen/a.

Přihlásit se do poradny

 

Vlákno diskusního fóra do docx

Od: rob odpovědí: 3 změna:
Existuje nějaká utilitka, která by mi na základě zadané adresy diskusního vlákna, udelala jeho kompletní uložení do formátu docx (včetně všech stránek)? Chci aby ten výstup v docx byl bez dalšího obsahu stránky, např. bez reklam...

 

 

3 odpovědi na otázku
Řazeno dle hodnocení

 

 


0x

Proč zrovna do docx? A jak si představuješ že to bude vypadat? Ta struktura bude hodně poničená pokud bude použitelná. Nestačí stránku jen stáhnout v prohlížeči (ctrl+s) a pak otevřít ve wordu?

Možná pokud to fórum má možnost zobrazit verzi pro tisk vláken, tak by to mohlo poskytnout použitelnou verzi (ale i tak to může být moc komplexní, záleží o co se jedná). Reklamy většinou ve verzích pro tisk nejsou.

Jestli to i tak chceš zkusit tak Pandoc (teď je jejich web dole ale můžeš ho získat i odtud) převádí spoustu formátů. Ale je to terminálový program. Nicméně používat ho není moc těžké: pandoc -i [vstupni soubor].html -o [vystupni soubor].nejakaPripona

Musíš ale mít tu stránku už staženou (přes prohlížeč nebo jiným nástrojem (wget ...))

Ale celkově mi přijde že se ptáš na něco co si myslíš že vyřeší tvůj problém a ne na tvůj problém. Chtělo by to napsat co si od toho slibuješ

 

dtfg1h7

0x

Nic takového přímo neznám.

Vím o utilitě HTTrack, která dokáže stáhnout web do souborů HTML, CSS, JS

A teď jak extrahovat vlákno diskuze... a jak je to s reklamou... Záleží asi na povaze reklamy, jak je umístěná jestli je jenom vedle nebo přímo v elementu vlákna diskuze, pak odstranění reklamy je poměrně složité, dnes není reklama v

protože by to lehce zablokovali AdBlokery, bude složité... ale nějaký skript nandi div s id="diskuze" a ulož ho...

Možná napsat vlastníkům diskuze/stránek, zda by nenapsali nějaký SQL export...

Znám doplněk Save Page WE, která dokáže stáhnout jednu stránku a přibalit dovnitř vnější CSS (alternativa Ctrl+S)

html jde otevřít ve Wordu, případě existuje aji plno online html to docx converter

V nejhorším fungují klávesové zkratky ctrl+A a ctrl+C ctrl+V


doplněno 05.06.23 20:18:

*dnes není reklama v *** protože ... Nezobrazuje se... Chtěl jsem napsat id="reklama"

 


0x
Jako asi by to šlo, ale někdo by ten slepenec musel naprogramovat, hlavně požadavek na docx je podivný. Musí to ýt automatické(píšeš zadání URL, takže větřím to) a pro více webů nebo jen pro jeden?
Asi nejjednodušíbyde to rovnou z prohlížeče zkopírovat do Wordů a dát Ctrl S. Jen předtím si pro danou webovku do blokátoru přidáš vlastní pravidla, který ti stránku pročistí a pozor, tajný trik, dokonce se můžeš nastavit vlastní filtr typu www.diskuze.cz##body:style(background-color:gray), ale možná by byl lepší user css
*a nebo trik: dát "režim čtečky"- třeba ti to poskytne uspokovivé výsledky.

 

 


 

 

 

Přihlásit se k odběru odpovědí z této otázky:

Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.

Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.

Copyright © 2004-2025 Poradna Poradte.cz. Všechna práva vyhrazena. Prohlášení o ochraně osobních údajů. | [tmavý motiv]