Le robot d’indexation écrit en Java n’a désormais plus la capacité de télécharger que des images (profondeur 1), et continuera...

Delver_Si · Publié sur 03/06/2015 02:38:12

Comme le titre l’indique

crawler.rar (62.53 KB, Nombre de téléchargements: 5, Prix de vente: 2 Grain MB)

microxdd · Publié sur 03/06/2015 21:05:36

Implémentation simple qui ne dépend pas d’autres packages

package test;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import javax.imageio.ImageIO;
public class Test {
public static void main(String[] args) {
String web="http://www.itsvse.com/";
try {
URL url=new URL(web);
InputStreamReader reader=new InputStreamReader(url.openStream());
StringBuilder builder=new StringBuilder();
char[] buff=new char[1024];
int n;
while((n=reader.read(buff))!=-1){
builder.append(buff,0,n);
}
Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
Matcher m=pattern.matcher(builder);
while (m.find()) {
String u=m.group(1)+m.group(2);
System.out.println("dowing.."+u);
URL img=null;
if(u.startsWith("http")){
img=new URL(u);
}else{
img=new URL(url,u);
}
ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
}
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}

Code de copie

microxdd · Publié sur 04/06/2015 19:19:48

Delver_Si Posté le 03-06-2015 à 23:57
Votre efficacité initiale en développement de code est trop faible, mauvaise critique

Je ne voulais rien dire, mais tu as dit que le développement est inefficace。。。。。

Le programme exige la qualité et les performances du code, et au final, il a peu de fonctions, une faible capacité d’expansion et de mauvaises performances

Exécutez 10 fois de suite, ignorez la latence réseau à chaque fois, ignorez les sauvegardes locales, et ne calculez que le temps nécessaire pour analyser les documents html, votre programme est loin de ça.
Aussi, il y a des erreurs dans ton code, donc je ne dirai rien

Petite ordure · Publié sur 03/06/2015 13:00:52

Delver_Si Publié le 03-6-2015 à 12:57
Comment est l’étude ?

Je n’ai pas installé Eclipse et je l’ai regardé dans un bloc-notes, j’ai d’abord récupéré le code source HTML de la page web, puis obtenu la valeur après src, et ensuite je l’ai sauvegardé

Je ne sais pas si c’est juste

Le couteau vole · Publié sur 03/06/2015 07:49:23

Peut-on récupérer des images au format PNG ?

Delver_Si · Publié sur 03/06/2015 10:17:34

Petit couteau volant couteau volant volant publié le 07:49 le 07-6-2015
Peut-on récupérer des images au format PNG ?

Oui, je n’ai pas encore jugé le suffixe, ils sont tous enregistrés en jpg, en fait, l’image png peut être ouverte avec un suffixe jpg, et je vais améliorer le suffixe

Petite ordure · Publié sur 03/06/2015 12:52:13

Laisse-moi étudier la recherche

Delver_Si · Publié sur 03/06/2015 12:57:13

Small slag Publié le 03-06-2015 à 12:52
Laisse-moi étudier la recherche

Comment est l’étude ?

Delver_Si · Publié sur 03/06/2015 13:05:27

Xiao Zhazha Publié le 03-06-2015 à 13:00
Je n’ai pas installé Eclipse et je l’ai regardé dans un bloc-notes, je prends d’abord le code source HTML de la page web, puis je prends la valeur après src, et ensuite j’enregistre le sommet ...

C’est vrai

Petite ordure · Publié sur 03/06/2015 21:12:09

microxdd publié le 03/06/2015 à 21:05
Implémentation simple qui ne dépend pas d’autres packages

C’est ce rythme qui m’oblige à installer myeclipse !

Delver_Si · Publié sur 03/06/2015 23:57:27

microxdd publié le 03/06/2015 à 21:05
Implémentation simple qui ne dépend pas d’autres packages

Votre efficacité initiale en développement de code est trop faible, mauvaise critique

[JavaSE] Le robot d’indexation écrit en Java n’a désormais plus la capacité de télécharger que des images (profondeur 1), et continuera...

Articles connexes

Sections vues