Dit artikel is een spiegelartikel van machinevertaling, klik hier om naar het oorspronkelijke artikel te gaan.

Bekijken: 32261|Antwoord: 11

[JavaSE] De crawler die net in Java is geschreven, kan nu alleen nog afbeeldingen downloaden (diepte 1), en zal doorgaan...

[Link kopiëren]
Geplaatst op 03-06-2015 02:38:12 | | | |
Zoals de titel al aangeeft, al doet vermoeden

crawler.rar (62.53 KB, Aantal downloads: 5, Verkoopprijs: 2 Grain MB)




Vorig:Weet je welke webcontainers asp.net hebben? Behalve IIS
Volgend:dedupliceer data en geef de collectie terug
Geplaatst op 03-06-2015 21:05:36 |
Eenvoudige implementatie die niet afhankelijk is van andere pakketten

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Code kopiëren
Geplaatst op 04-06-2015 19:19:48 |
Delver_Si Geplaatst op 2015-6-3 23:57
Je oorspronkelijke code-ontwikkelingsefficiëntie is te laag, slechte review

Ik wilde er niets over zeggen, maar je zei dat ontwikkeling inefficiënt is。。。。。

Het programma vereist de kwaliteit en prestaties van de code, en uiteindelijk heeft het weinig functies, slechte uitbreidbaarheid en slechte prestaties


Voer het tien keer achter elkaar uit, negeer netwerklatentie elke keer, negeer lokale saves en bereken alleen de tijd om html-documenten te parsen, je programma zit er ver van.
Ook zitten er fouten in je code, dus ik zal er niets over zeggen

Geplaatst op 03-06-2015 13:00:52 |

Ik heb Eclipse niet geïnstalleerd en het in een notitieblok bekeken, eerst de HTML-broncode van de webpagina gepakt, daarna de waarde na src gehaald, en daarna opgeslagen   

Ik weet niet of het goed is  
Geplaatst op 03-06-2015 07:49:23 |
Kunnen afbeeldingen in PNG-formaat worden gedownload?
 Huisbaas| Geplaatst op 03-06-2015 10:17:34 |
Klein mes vliegend mes vliegen vliegen gepubliceerd op 3 juni 2015 07:49
Kunnen afbeeldingen in PNG-formaat worden gedownload?

Ja, ik heb het achtervoegsel nu nog niet beoordeeld, ze zijn allemaal opgeslagen als jpg, in feite kan de png-afbeelding worden geopend met een jpg-achtervoegsel, en ik zal het achtervoegsel verbeteren
Geplaatst op 03-06-2015 12:52:13 |
Laat me het onderzoek bestuderen
 Huisbaas| Geplaatst op 03-06-2015 12:57:13 |
Kleine Geplaatst op 2015-6-3 12:52
Laat me het onderzoek bestuderen

Hoe is het onderzoek?
 Huisbaas| Geplaatst op 03-06-2015 13:05:27 |
Xiao Zhazha Geplaatst op 3-6-2015 13:00
Ik heb Eclipse niet geïnstalleerd en het in een notitieblok bekeken, eerst de html-broncode van de webpagina gepakt, dan de waarde na src opgehaald, en daarna de ruwe versie opgeslagen ...

Dat klopt
Geplaatst op 03-06-2015 21:12:09 |
microxdd geplaatst op 3-6-2015 21:05
Eenvoudige implementatie die niet afhankelijk is van andere pakketten

Dit is het ritme dat me dwingt om myeclipse te installeren!
 Huisbaas| Geplaatst op 03-06-2015 23:57:27 |
microxdd geplaatst op 3-6-2015 21:05
Eenvoudige implementatie die niet afhankelijk is van andere pakketten

Je oorspronkelijke code-ontwikkelingsefficiëntie is te laag, slechte review
Disclaimer:
Alle software, programmeermaterialen of artikelen die door Code Farmer Network worden gepubliceerd, zijn uitsluitend bedoeld voor leer- en onderzoeksdoeleinden; De bovenstaande inhoud mag niet worden gebruikt voor commerciële of illegale doeleinden, anders dragen gebruikers alle gevolgen. De informatie op deze site komt van het internet, en auteursrechtconflicten hebben niets met deze site te maken. Je moet bovenstaande inhoud volledig van je computer verwijderen binnen 24 uur na het downloaden. Als je het programma leuk vindt, steun dan de echte software, koop registratie en krijg betere echte diensten. Als er sprake is van een inbreuk, neem dan contact met ons op via e-mail.

Mail To:help@itsvse.com