Jak na script co mi najde co potřebuji

Od: Datum: 24.03.13 13:16 odpovědí: 7 změna: 26.03.13 02:28

Ahoj často něco hledám a zajímalo by mě jestli lze napsat script, který mi na stránkách najde třeba nějaký text, obrázek podle rozlišení, gify apod... Díky


Seznam odpovědí:
 
moment čekejte prosím, probíhá přenos dat...
Zobrazení struktury odpovědí v otázce
Skrytí struktury odpovědí v otázce
Zobrazení struktury odpovědí v otázce

 

Odpovědi na otázku:
Datum: 24.03.13 14:18
avatar

PHP + regulary

doplněno 24.03.13 14:19:

rozhodne to neni uplne jednoduche, kor bez nejakych znalosti

Ohodnoceno: 0x
 
Datum: 24.03.13 17:03
avatar

S tím obrázkem podle rozlišení bude problém, podle velikosti v kB to je jednoduché, ale podle šířky a výšky to bude dost práce navíc.

Obecně to můžete napsat v čemkoli chcete, podle toho, co to všechno bude mět umět, budete potřebovat web crawler a xml parser / vlastní rekurzivní parser. K tomu pak něco na vyhledávání hledaného obsahu, nejspíš ty regulární výrazy.

Nestačilo by pro běžné vyhledávání textů a obrázků použít google + omezení na cílovou doménu? (za dotaz připojit třeba site:poradte.cz) Tam si velikost vybrat můžete.

Nebo jste myslel prohledávat komplet celý internet? Jedině hledat vhodným dotazem v existujících vyhledávačích.

Nebo snad hledat v porhlížeči pouze na stránce, kterou už máte otevřenou? Mohl by existovat vhodný doplněk, případně by se dal vytvořit jednoduchý bookmarklet.

doplněno 24.03.13 18:59:

Tak v jedné stránce, kterou už máte otevřenou, to je celkem jednoduché. Pokud hledáte přímo text, tak ctrl+F, napíšete pár znaků, pak s ctrl+G (nebo v exploreru enterováním) skáčete na další výskyty.

V celém textu (včetně zdrojáku) se dá hledat taky, ten otevřete buď F8, nebo ctrl+U.

Obrázky nejjednodušeji najdete třeba v chromu, když zmáčknete F12, přepnete na Resources, otevřete Frames a pak Images, tam uvidíte všechny načtené obrázky pohromadě, můžete si jen vybrat. V opeře podobně, jen se tam dostanete přes ctrl+shift+I.

Ono těžko doporučovat postup, když (mi) není úplně jasné, co se jím má získat.

Ohodnoceno: 2x
 
Datum: 24.03.13 18:47

Podle velikosti kdyby šlo třeba 4-6kb by to taky šlo ;)

Jenom na jedný stránce nějaký doplňek by bodl, ale moc se v tom nevyznám ;)

Datum: 24.03.13 19:01

Mě by zajímalo jestli se to nedá právě hledat na celým webu úplně ;) To je asi nemožné a pokud jo tak bych se to stejně asi nezvládl? :)

Od: luke237
Datum: 24.03.13 23:26
Nalezeni textu na strankach: wget -q URL -O - | grep hledany_text
Stahnuti vsech GIFu a JPG: wget -np -A gif,jpg URL
Stahovani podle velikosti: Tohle te tezsi, protoze se musi vyzadat ten soubor (wget -spider -S URL/soubor), zjistit si, jakou velikost posila server v hlavicke v hodnote Length a podle toho se pak rozhodnout, jestli to stahnout nebo ne.
Stahovani podle rozliseni: tohle je asi nejslozitejsi, protoze rozliseni se da zjistit az primo z toho stazeneho souboru. Nastesti je to typicky na jeho zacatku, takze stahnes prvni rekneme 2KB, prozenes to programem, ktery umi z hlavicky dekodovat parametry toho obrazku a podle toho,c o ti vypadne v policku "Rozliseni" to bud stahnes nebo se presunes na dalsi obrazek. Problem bude u formatu (obrazku), ktere maji v sobe vice hlavicek rozmistenych v ruzne hloubce. To bys pak musel prochazet celou strukturu hlavicek (tzn. byt si jisty, ze jsi v prvnim natazenim pritahl dostatene velkou velikost souboru, pripadne dotahovat chybejici casti). Moc www serveru ale neumi posilat jen casti souboru nebo navic jeste casti z prostredka souboru. Musel by jsi je tedy stahnout cele a pak si je bud ponechat nebo je smazat :(
Ohodnoceno: 0x
 
Datum: 25.03.13 17:40

Stahnuti vsech GIFu a JPG: wget -np -A gif,jpg URL
Když zkusím třeba www.mobilmania.cz kam to mám zadat? Díky ;)

Od: luke237
Datum: 26.03.13 02:28
Stahnes si (predpokladam, ze mas Windows®) program wget (nebo podobny web crawler) a pak v "DOS-ovem" okne zadas: wget -r -l5 -A gif,jpg http://www.mobilmania.cz
Ohodnoceno: 0x
 

 

 

 

 

Přihlásit se k odběru odpovědí z této otázky:

Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz

 
Copyright © 2004-2016 Poradna Poradte.cz. Všechna práva na poradně Poradte.cz vyhrazena.