Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 32261|Resposta: 11

[JavaSE] O crawler acabado de escrever em Java agora só tem a capacidade de baixar imagens (profundidade 1), e continuará...

[Copiar link]
Publicado em 03/06/2015 02:38:12 | | | |
Como o título sugere

crawler.rar (62.53 KB, Número de downloads: 5, Preço de venda: 2 Grain MB)




Anterior:Você sabe quais contêineres web asp.net têm? Exceto IIS
Próximo:Desativar os dados e devolver a coleção
Publicado em 03/06/2015 21:05:36 |
Implementação simples que não depende de outros pacotes

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Copiar código
Publicado em 04/06/2015 19:19:48 |
Delver_Si Postado em 2015-6-3 às 23:57
Sua eficiência de desenvolvimento original de código está muito baixa, avaliação ruim

Eu não quis dizer nada, mas você disse que o desenvolvimento é ineficiente。。。。。

O programa exige a qualidade e o desempenho do código e, no final, possui poucas funções, pouca capacidade de expansão e baixo desempenho


Execute 10 vezes seguidas, ignore a latência da rede todas as vezes, ignore os saves locais e calcule apenas o tempo para analisar documentos html, seu programa está longe disso.
Além disso, há erros no seu código, então não vou dizer nada

Publicado em 03/06/2015 13:00:52 |

Eu não instalei o eclipse e olhei em um bloco de notas, primeiro peguei o código-fonte HTML da página web, depois obtive o valor depois do src, e então salvei   

Não sei se é certo  
Publicado em 03/06/2015 07:49:23 |
Imagens em formato PNG podem ser capturadas?
 Senhorio| Publicado em 03/06/2015 10:17:34 |

Sim, ainda não julguei o sufixo, todos eles são salvos como jpg, na verdade, a imagem png pode ser aberta com um sufixo jpg, e vou melhorar o sufixo
Publicado em 03/06/2015 12:52:13 |
Deixe-me estudar a pesquisa
 Senhorio| Publicado em 03/06/2015 12:57:13 |
Small slag Postado em 2015-6-3 12:52
Deixe-me estudar a pesquisa

Como é o estudo?
 Senhorio| Publicado em 03/06/2015 13:05:27 |
Xiao Zhazha Postado em 2015-6-3 13:00
Eu não instalei o Eclipse e olhei em um bloco de notas, primeiro pego o código-fonte html da página web, depois pego o valor depois do src, e então salvo o bruto...

Isso é verdade
Publicado em 03/06/2015 21:12:09 |
microxdd postado em 03-06-2015 às 21:05
Implementação simples que não depende de outros pacotes

Esse é o ritmo que me obriga a instalar o myeclipse!
 Senhorio| Publicado em 03/06/2015 23:57:27 |
microxdd postado em 03-06-2015 às 21:05
Implementação simples que não depende de outros pacotes

Sua eficiência de desenvolvimento original de código está muito baixa, avaliação ruim
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com