Denne artikel er en spejling af maskinoversættelse, klik venligst her for at springe til den oprindelige artikel.

Udsigt: 32261|Svar: 11

[JavaSE] Crawleren, der netop er skrevet i Java, har nu kun mulighed for at downloade billeder (dybde 1), og vil fortsætte...

[Kopier link]
Opslået på 03/06/2015 02.38.12 | | | |
Som titlen antyder,

crawler.rar (62.53 KB, Antal downloads: 5, Salgspris: 2 Korn MB)




Tidligere:Ved du, hvilke webcontainere asp.net har? Undtagen IIS
Næste:dedupliker data og returnerer samlingen
Opslået på 03/06/2015 21.05.36 |
Simpel implementering, der ikke afhænger af andre pakker

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Kopier kode
Opslået på 04/06/2015 19.19.48 |
Delver_Si Opslået den 2015-6-3 kl. 23:57
Din oprindelige kodeudviklingseffektivitet er for lav, dårlig anmeldelse

Jeg ville ikke sige noget, men du sagde, at udvikling er ineffektiv。。。。。

Programmet kræver kvaliteten og ydeevnen af koden, og i sidste ende har det få funktioner, dårlig udvidelsesevne og dårlig ydeevne


Kør 10 gange i træk, ignorer netværkslatens hver gang, ignorer lokale gemninger og beregn kun tiden til at parse html-dokumenter, dit program er langt fra det.
Der er også fejl i din kode, så jeg vil ikke sige noget

Opslået på 03/06/2015 13.00.52 |

Jeg installerede ikke eclipse og kiggede på det i en notesblok, først hentede jeg HTML-kildekoden fra websiden, fik så værdien efter src, og gemte den så   

Jeg ved ikke, om det er rigtigt  
Opslået på 03/06/2015 07.49.23 |
Kan billeder i PNG-format hentes?
 Udlejer| Opslået på 03/06/2015 10.17.34 |

Ja, jeg har ikke dømt endelsen nu, alle er gemt som jpg, faktisk kan png-billedet åbnes med et jpg-suffiks, og jeg vil forbedre endelsen
Opslået på 03/06/2015 12.52.13 |
Lad mig studere forskningen
 Udlejer| Opslået på 03/06/2015 12.57.13 |

Hvordan går studiet?
 Udlejer| Opslået på 03/06/2015 13.05.27 |
Xiao Zhazha Opslået den 3-6-2015 kl. 13:00
Jeg installerede ikke Eclipse og kiggede på det i en notesblok, først henter jeg html-kildekoden til websiden, får så værdien efter src, og gemmer så ruden ...

Det er sandt
Opslået på 03/06/2015 21.12.09 |
microxdd postet den 3-6-2015 kl. 21:05
Simpel implementering, der ikke afhænger af andre pakker

Det er denne rytme, der tvinger mig til at installere myeclipse!
 Udlejer| Opslået på 03/06/2015 23.57.27 |
microxdd postet den 3-6-2015 kl. 21:05
Simpel implementering, der ikke afhænger af andre pakker

Din oprindelige kodeudviklingseffektivitet er for lav, dårlig anmeldelse
Ansvarsfraskrivelse:
Al software, programmeringsmaterialer eller artikler udgivet af Code Farmer Network er kun til lærings- og forskningsformål; Ovenstående indhold må ikke bruges til kommercielle eller ulovlige formål, ellers skal brugerne bære alle konsekvenser. Oplysningerne på dette site kommer fra internettet, og ophavsretstvister har intet med dette site at gøre. Du skal slette ovenstående indhold fuldstændigt fra din computer inden for 24 timer efter download. Hvis du kan lide programmet, så understøt venligst ægte software, køb registrering og få bedre ægte tjenester. Hvis der er nogen overtrædelse, bedes du kontakte os via e-mail.

Mail To:help@itsvse.com