Artikel ini adalah artikel cermin dari terjemahan mesin, silakan klik di sini untuk melompat ke artikel aslinya.

Melihat: 32261|Jawab: 11

[JavaSE] Perayap yang baru saja ditulis dalam bahasa Java, sekarang hanya memiliki kemampuan untuk mengunduh gambar (kedalaman 1), dan akan melanjutkan...

[Salin tautan]
Diposting pada 03/06/2015 02.38.12 | | | |
Seperti judulnya

crawler.rar (62.53 KB, Jumlah unduhan: 5, Harga jual: 2 Biji-bijian MB)




Mantan:Tahukah Anda wadah web apa yang asp.net miliki? Kecuali IIS
Depan:Deduplikasi data dan mengembalikan koleksi
Diposting pada 03/06/2015 21.05.36 |
Implementasi sederhana yang tidak bergantung pada paket lain

  1. package test;

  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.net.MalformedURLException;
  6. import java.net.URL;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. import javax.imageio.ImageIO;

  10. public class Test {
  11.         public static void main(String[] args) {
  12.                 String web="http://www.itsvse.com/";
  13.                 try {
  14.                         URL url=new URL(web);
  15.                         InputStreamReader reader=new InputStreamReader(url.openStream());
  16.                        
  17.                         StringBuilder builder=new StringBuilder();
  18.                         char[] buff=new char[1024];
  19.                         int n;
  20.                         while((n=reader.read(buff))!=-1){
  21.                                 builder.append(buff,0,n);
  22.                         }
  23.                        
  24.                         Pattern pattern=Pattern.compile("<img.*?src="(.*?)(gif|png|jpg)"");
  25.                        
  26.                         Matcher m=pattern.matcher(builder);
  27.                         while (m.find()) {
  28.                                 String u=m.group(1)+m.group(2);
  29.                                 System.out.println("dowing.."+u);
  30.                                 URL img=null;
  31.                                 if(u.startsWith("http")){
  32.                                         img=new URL(u);
  33.                                 }else{
  34.                                         img=new URL(url,u);
  35.                                 }
  36.                                 ImageIO.write(ImageIO.read(img), m.group(2), new File("D:/img/"+System.currentTimeMillis()+"."+m.group(2)));
  37.                                
  38.                         }
  39.                        
  40.                 } catch (MalformedURLException e) {
  41.                         // TODO Auto-generated catch block
  42.                         e.printStackTrace();
  43.                 } catch (IOException e) {
  44.                         // TODO Auto-generated catch block
  45.                         e.printStackTrace();
  46.                 }
  47.         }
  48. }
Salin kode
Diposting pada 04/06/2015 19.19.48 |
Delver_Si Dipaparkan pada 2015-6-3 23:57
Efisiensi pengembangan kode asli Anda terlalu rendah, ulasan buruk

Saya tidak ingin mengatakan apa-apa, tetapi Anda mengatakan bahwa pengembangan tidak efisien。。。。。

Program ini membutuhkan kualitas dan kinerja kode, dan pada akhirnya, ia memiliki sedikit fungsi, kemampuan ekspansi yang buruk, dan kinerja yang buruk


Jalankan 10 kali berturut-turut, abaikan latensi jaringan setiap kali, abaikan penyimpanan lokal, dan hanya hitung waktu untuk mengurai dokumen html, program Anda jauh dari itu.
Juga, ada kesalahan dalam kode Anda, jadi saya tidak akan mengatakan apa-apa

Diposting pada 03/06/2015 13.00.52 |

Saya tidak menginstal eclipse dan melihatnya di notepad, pertama-tama mengambil kode sumber HTML dari halaman web, lalu mendapatkan nilai setelah src, dan kemudian menyimpannya   

Saya tidak tahu apakah itu benar  
Diposting pada 03/06/2015 07.49.23 |
Bisakah gambar dalam format PNG diambil?
 Tuan tanah| Diposting pada 03/06/2015 10.17.34 |

Ya, saya belum menilai akhirannya sekarang, semuanya disimpan sebagai jpg, pada kenyataannya, gambar png dapat dibuka dengan akhiran jpg, dan saya akan memperbaiki akhiran
Diposting pada 03/06/2015 12.52.13 |
Izinkan saya mempelajari penelitiannya
 Tuan tanah| Diposting pada 03/06/2015 12.57.13 |
Terak kecil Dipaparkan pada 2015-6-3 12:52
Izinkan saya mempelajari penelitiannya

Bagaimana penelitiannya?
 Tuan tanah| Diposting pada 03/06/2015 13.05.27 |
Xiao Zhazha Dipaparkan pada 2015-6-3 13:00
Saya tidak menginstal eclipse dan melihatnya di notepad, pertama-tama ambil kode sumber html dari halaman web, lalu dapatkan nilainya setelah src, dan kemudian simpan kasar ...

Itu benar
Diposting pada 03/06/2015 21.12.09 |
microxdd Posted on 2015-6-3 21:05
Implementasi sederhana yang tidak bergantung pada paket lain

Ini adalah ritme yang memaksa saya untuk menginstal myeclipse!
 Tuan tanah| Diposting pada 03/06/2015 23.57.27 |
microxdd Posted on 2015-6-3 21:05
Implementasi sederhana yang tidak bergantung pada paket lain

Efisiensi pengembangan kode asli Anda terlalu rendah, ulasan buruk
Sanggahan:
Semua perangkat lunak, materi pemrograman, atau artikel yang diterbitkan oleh Code Farmer Network hanya untuk tujuan pembelajaran dan penelitian; Konten di atas tidak boleh digunakan untuk tujuan komersial atau ilegal, jika tidak, pengguna akan menanggung semua konsekuensi. Informasi di situs ini berasal dari Internet, dan sengketa hak cipta tidak ada hubungannya dengan situs ini. Anda harus sepenuhnya menghapus konten di atas dari komputer Anda dalam waktu 24 jam setelah pengunduhan. Jika Anda menyukai program ini, harap dukung perangkat lunak asli, pembelian pendaftaran, dan dapatkan layanan asli yang lebih baik. Jika ada pelanggaran, silakan hubungi kami melalui email.

Mail To:help@itsvse.com