Denne artikkelen er en speilartikkel om maskinoversettelse, vennligst klikk her for å hoppe til originalartikkelen.

Utsikt: 32261|Svare: 11

[JavaSE] Crawleren som nettopp er skrevet i Java, har nå bare mulighet til å laste ned bilder (dybde 1), og vil fortsette...

[Kopier lenke]
Publisert på 03.06.2015 02:38:12 | | | |
Som tittelen antyder

crawler.rar (62.53 KB, Antall nedlastinger: 5, Salgspris: 2 Korn MB)




Foregående:Vet du hvilke webcontainere asp.net har? Bortsett fra IIS
Neste:deduplisere data og returnere samlingen
Publisert på 03.06.2015 21:05:36 |
Enkel implementering som ikke er avhengig av andre pakker

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Kopier koden
Publisert på 04.06.2015 19:19:48 |
Delver_Si Publisert 3.06.2015 kl. 23:57
Din opprinnelige kodeutviklingseffektivitet er for lav, dårlig anmeldelse

Jeg ville ikke si noe, men du sa at utvikling er ineffektivt。。。。。

Programmet krever kvaliteten og ytelsen til koden, og til syvende og sist har det få funksjoner, dårlig ekspansjonsevne og dårlig ytelse


Kjør 10 ganger på rad, ignorer nettverksforsinkelse hver gang, ignorer lokale lagringer, og regn kun ut tiden det tar å parse html-dokumenter, programmet ditt er langt fra det.
Det er også feil i koden din, så jeg sier ingenting

Publisert på 03.06.2015 13:00:52 |

Jeg installerte ikke Eclipse og så på det i en notatblokk, hentet først HTML-kildekoden til nettsiden, så fikk jeg verdien etter src, og lagret den deretter   

Jeg vet ikke om det er riktig  
Publisert på 03.06.2015 07:49:23 |
Kan bilder i PNG-format hentes?
 Vert| Publisert på 03.06.2015 10:17:34 |

Ja, jeg har ikke dømt suffikset nå, alle lagres som jpg, faktisk kan png-bildet åpnes med et jpg-suffiks, og jeg vil forbedre suffikset
Publisert på 03.06.2015 12:52:13 |
La meg studere forskningen
 Vert| Publisert på 03.06.2015 12:57:13 |
Liten slagg Publisert 2015-6-3 12:52
La meg studere forskningen

Hvordan er studien?
 Vert| Publisert på 03.06.2015 13:05:27 |
Xiao Zhazha Publisert 2015-6-3 13:00
Jeg installerte ikke Eclipse og så på det i en notatblokk, først hentet jeg html-kildekoden til nettsiden, så hentet verdien etter src, og lagret så grovfilen ...

Det stemmer
Publisert på 03.06.2015 21:12:09 |
microxdd publisert 2015-6-3 21:05
Enkel implementering som ikke er avhengig av andre pakker

Dette er rytmen som tvinger meg til å installere myeclipse!
 Vert| Publisert på 03.06.2015 23:57:27 |
microxdd publisert 2015-6-3 21:05
Enkel implementering som ikke er avhengig av andre pakker

Din opprinnelige kodeutviklingseffektivitet er for lav, dårlig anmeldelse
Ansvarsfraskrivelse:
All programvare, programmeringsmateriell eller artikler publisert av Code Farmer Network er kun for lærings- og forskningsformål; Innholdet ovenfor skal ikke brukes til kommersielle eller ulovlige formål, ellers skal brukerne bære alle konsekvenser. Informasjonen på dette nettstedet kommer fra Internett, og opphavsrettstvister har ingenting med dette nettstedet å gjøre. Du må fullstendig slette innholdet ovenfor fra datamaskinen din innen 24 timer etter nedlasting. Hvis du liker programmet, vennligst støtt ekte programvare, kjøp registrering, og få bedre ekte tjenester. Hvis det foreligger noen krenkelse, vennligst kontakt oss på e-post.

Mail To:help@itsvse.com