Nejste přihlášen/a.
Ahoj často něco hledám a zajímalo by mě jestli lze napsat script, který mi na stránkách najde třeba nějaký text, obrázek podle rozlišení, gify apod... Díky
2x
S tím obrázkem podle rozlišení bude problém, podle velikosti v kB to je jednoduché, ale podle šířky a výšky to bude dost práce navíc.
Obecně to můžete napsat v čemkoli chcete, podle toho, co to všechno bude mět umět, budete potřebovat web crawler a xml parser / vlastní rekurzivní parser. K tomu pak něco na vyhledávání hledaného obsahu, nejspíš ty regulární výrazy.
Nestačilo by pro běžné vyhledávání textů a obrázků použít google + omezení na cílovou doménu? (za dotaz připojit třeba site:poradte.cz) Tam si velikost vybrat můžete.
Nebo jste myslel prohledávat komplet celý internet? Jedině hledat vhodným dotazem v existujících vyhledávačích.
Nebo snad hledat v porhlížeči pouze na stránce, kterou už máte otevřenou? Mohl by existovat vhodný doplněk, případně by se dal vytvořit jednoduchý bookmarklet.
doplněno 24.03.13 18:59:Tak v jedné stránce, kterou už máte otevřenou, to je celkem jednoduché. Pokud hledáte přímo text, tak ctrl+F, napíšete pár znaků, pak s ctrl+G (nebo v exploreru enterováním) skáčete na další výskyty.
V celém textu (včetně zdrojáku) se dá hledat taky, ten otevřete buď F8, nebo ctrl+U.
Obrázky nejjednodušeji najdete třeba v chromu, když zmáčknete F12, přepnete na Resources, otevřete Frames a pak Images, tam uvidíte všechny načtené obrázky pohromadě, můžete si jen vybrat. V opeře podobně, jen se tam dostanete přes ctrl+shift+I.
Ono těžko doporučovat postup, když (mi) není úplně jasné, co se jím má získat.
Podle velikosti kdyby šlo třeba 4-6kb by to taky šlo ![]()
Jenom na jedný stránce nějaký doplňek by bodl, ale moc se v tom nevyznám ![]()
Mě by zajímalo jestli se to nedá právě hledat na celým webu úplně
To je asi nemožné a pokud jo tak bych se to stejně asi nezvládl? ![]()
Stahnuti vsech GIFu a JPG: wget -np -A gif,jpg URL
Stahovani podle velikosti: Tohle te tezsi, protoze se musi vyzadat ten soubor (wget -spider -S URL/soubor), zjistit si, jakou velikost posila server v hlavicke v hodnote Length a podle toho se pak rozhodnout, jestli to stahnout nebo ne.
Stahovani podle rozliseni: tohle je asi nejslozitejsi, protoze rozliseni se da zjistit az primo z toho stazeneho souboru. Nastesti je to typicky na jeho zacatku, takze stahnes prvni rekneme 2KB, prozenes to programem, ktery umi z hlavicky dekodovat parametry toho obrazku a podle toho,c o ti vypadne v policku "Rozliseni" to bud stahnes nebo se presunes na dalsi obrazek. Problem bude u formatu (obrazku), ktere maji v sobe vice hlavicek rozmistenych v ruzne hloubce. To bys pak musel prochazet celou strukturu hlavicek (tzn. byt si jisty, ze jsi v prvnim natazenim pritahl dostatene velkou velikost souboru, pripadne dotahovat chybejici casti). Moc www serveru ale neumi posilat jen casti souboru nebo navic jeste casti z prostredka souboru. Musel by jsi je tedy stahnout cele a pak si je bud ponechat nebo je smazat
wget -r -l5 -A gif,jpg mobilmania.cz/...
Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.
Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.