Questo articolo è un articolo speculare di traduzione automatica, clicca qui per saltare all'articolo originale.

Vista: 32261|Risposta: 11

[JavaSE] Il crawler appena scritto in Java ora ha solo la possibilità di scaricare immagini (profondità 1), e continuerà...

[Copiato link]
Pubblicato su 03/06/2015 02:38:12 | | | |
Come suggerisce il titolo

crawler.rar (62.53 KB, Numero di download: 5, Prezzo di vendita: 2 Grain MB)




Precedente:Sai quali container web asp.net possiedono? Tranne IIS
Prossimo:deduplicare i dati e restituire la collezione
Pubblicato su 03/06/2015 21:05:36 |
Implementazione semplice che non dipende da altri pacchetti

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Copia codice
Pubblicato su 04/06/2015 19:19:48 |
Delver_Si Pubblicato il 3-6-2015 alle 23:57
La tua efficienza nello sviluppo del codice originale è troppo bassa, recensione negativa

Non volevo dire nulla, ma hai detto che lo sviluppo è inefficiente。。。。。

Il programma richiede la qualità e le prestazioni del codice e, alla fine, ha poche funzioni, scarsa capacità di espansione e scarse prestazioni


Esegui 10 volte di fila, ignora ogni volta la latenza di rete, ignora i salvataggi locali e calcola solo il tempo per analizzare i documenti html, il tuo programma è tutt'altro che questo.
Inoltre, ci sono errori nel tuo codice, quindi non dirò nulla

Pubblicato su 03/06/2015 13:00:52 |

Non ho installato Eclipse e l'ho guardato in un blocco note, prima ho preso il codice sorgente HTML della pagina web, poi il valore dopo src, e infine l'ho salvato   

Non so se sia giusto  
Pubblicato su 03/06/2015 07:49:23 |
È possibile acquisire immagini in formato PNG?
 Padrone di casa| Pubblicato su 03/06/2015 10:17:34 |

Sì, non ho giudicato il suffisso finora, tutti sono salvati come jpg, infatti l'immagine png può essere aperta con un suffisso jpg, e migliorerò il suffisso
Pubblicato su 03/06/2015 12:52:13 |
Lasciami studiare la ricerca
 Padrone di casa| Pubblicato su 03/06/2015 12:57:13 |
Small slag Pubblicato il 3-6-2015 12:52
Lasciami studiare la ricerca

Com'è lo studio?
 Padrone di casa| Pubblicato su 03/06/2015 13:05:27 |
Xiao Zhazha Pubblicato il 3-6-2015 alle 13:00
Non ho installato Eclipse e l'ho guardato in un notebook, prima prendo il codice sorgente html della pagina web, poi ottengo il valore dopo src, e infine salvo il grosso ...

Questo è vero
Pubblicato su 03/06/2015 21:12:09 |
microxdd pubblicato il 3-6-2015 alle 21:05
Implementazione semplice che non dipende da altri pacchetti

Questo è il ritmo che mi costringe a installare myeclipse!
 Padrone di casa| Pubblicato su 03/06/2015 23:57:27 |
microxdd pubblicato il 3-6-2015 alle 21:05
Implementazione semplice che non dipende da altri pacchetti

La tua efficienza nello sviluppo del codice originale è troppo bassa, recensione negativa
Disconoscimento:
Tutto il software, i materiali di programmazione o gli articoli pubblicati dalla Code Farmer Network sono destinati esclusivamente all'apprendimento e alla ricerca; I contenuti sopra elencati non devono essere utilizzati per scopi commerciali o illegali, altrimenti gli utenti dovranno sostenere tutte le conseguenze. Le informazioni su questo sito provengono da Internet, e le controversie sul copyright non hanno nulla a che fare con questo sito. Devi eliminare completamente i contenuti sopra elencati dal tuo computer entro 24 ore dal download. Se ti piace il programma, ti preghiamo di supportare software autentico, acquistare la registrazione e ottenere servizi autentici migliori. In caso di violazione, vi preghiamo di contattarci via email.

Mail To:help@itsvse.com