Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 32261|Odpoveď: 11

[JavaSE] Crawler práve napísaný v Jave, teraz má možnosť sťahovať len obrázky (hĺbka 1) a bude pokračovať...

[Kopírovať odkaz]
Zverejnené 3. 6. 2015 2:38:12 | | | |
Ako naznačuje názov

crawler.rar (62.53 KB, Počet stiahnutí: 5, Predajná cena: 2 Zrno MB)




Predchádzajúci:Viete, aké webové kontajnery asp.net mať? Okrem IIS
Budúci:deduplikujte dáta a vráťte kolekciu
Zverejnené 3. 6. 2015 21:05:36 |
Jednoduchá implementácia, ktorá nezávisí od iných balíkov

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Kopírovať kód
Zverejnené 4. 6. 2015 19:19:48 |
Delver_Si Zverejnené 3.6.2015 o 23:57
Efektivita vášho pôvodného vývoja kódu je príliš nízka, zlá kontrola

Nechcel som nič hovoriť, ale povedali ste, že rozvoj je neefektívny。。。。。

Program vyžaduje kvalitu a výkon kódu, a nakoniec má málo funkcií, slabú schopnosť rozširovania a slabý výkon


Spusti to desaťkrát za sebou, ignoruj latenciu siete zakaždým, ignoruj lokálne uloženia a počítaj len čas na analýzu html dokumentov, tvoj program je od toho ďaleko.
Tiež sú chyby v tvojom kóde, takže nič nebudem hovoriť

Zverejnené 3. 6. 2015 13:00:52 |

Neinštaloval som Eclipse a nepozrel som si ho v poznámkovom bloku, najprv som si zobral zdrojový kód HTML stránky, potom som získal hodnotu po src a nakoniec som to uložil   

Neviem, či je to správne  
Zverejnené 3. 6. 2015 7:49:23 |
Dajú sa obrázky vo formáte PNG snímať?
 Prenajímateľ| Zverejnené 3. 6. 2015 10:17:34 |

Áno, zatiaľ som nehodnotil príponu, všetky sú uložené ako jpg, vlastne obrázok png sa dá otvoriť s príponou jpg a príponu vylepším
Zverejnené 3. 6. 2015 12:52:13 |
Dovoľ mi študovať výskum
 Prenajímateľ| Zverejnené 3. 6. 2015 12:57:13 |
Small slag Zverejnené 2015-6-3 12:52
Dovoľ mi študovať výskum

Ako je na tom štúdia?
 Prenajímateľ| Zverejnené 3. 6. 2015 13:05:27 |
Xiao Zhazha Zverejnené 3.6.2015 o 13:00
Neinštaloval som Eclipse a nepozeral sa naň v poznámkovom bloku, najprv som si stiahol zdrojový kód html webovej stránky, potom získal hodnotu po src a nakoniec uložil hrubé ...

To je pravda
Zverejnené 3. 6. 2015 21:12:09 |
microxdd zverejnené 3.6.2015 21:05
Jednoduchá implementácia, ktorá nezávisí od iných balíkov

Toto je rytmus, ktorý ma núti nainštalovať myeclipse!
 Prenajímateľ| Zverejnené 3. 6. 2015 23:57:27 |
microxdd zverejnené 3.6.2015 21:05
Jednoduchá implementácia, ktorá nezávisí od iných balíkov

Efektivita vášho pôvodného vývoja kódu je príliš nízka, zlá kontrola
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com