Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 585936|Atbildi: 70

[Konsoles programma] .net/c# Ceļš uz tīmekļa rāpuļprogrammas optimizāciju

  [Kopēt saiti]
Publicēts 19.04.2018 14:21:02 | | | |
0x00

Tīmekļa rāpuļprogramma (pazīstama arī kā tīmekļa zirneklis, tīmekļa robots, FOAF kopienā biežāk saukta par tīmekļa pakaļdzītāju) ir programma vai skripts, kas automātiski nokasa informāciju par globālo tīmekli saskaņā ar noteiktiem noteikumiem. Citi retāk lietoti nosaukumi ir skudras, automātiskie indeksi, simulatori vai tārpi.

0x01

Vienkārši sakot, rāpuļprogrammas satver datus saskaņā ar saviem noteikumiem, analizē iegūtos datus un pēc tam iegūst sev noderīgus datus.

0x02

Tīmekļa rāpuļprogrammas optimizāciju var iedalīt divos posmos:

1: Optimizējiet datu skrāpēšanu;

2: Optimizējiet rezultātu apstrādi;

Šodien mēs runājam tikai par optimizāciju skrāpēšanas procesā!

0x03

Es esmu apkopojis dažus punktus par optimizāciju pārmeklēšanas procesā:

1: To var optimizēt fiziskajā adresē, piemēram: mērķa resursu serveris ir Tencent Cloud resursdators Šanhajā, mēs cenšamies izvēlēties serveri tajā pašā reģionā, tas ir, serveri Šanhajas reģionā, neizvēlieties serveri Pekinā, Čingdao un citos reģionos, bet arī mēģiniet izvēlēties serveri tajā pašā IDC datortelpā, mēs zinām, ka šī resursu vietne ir Tencent Cloud serveris, mēs cenšamies ievietot rāpuļprogrammu Tencent Cloud serverī, nevis Alibaba Cloud serverī!

2: Izvēlieties stabilu un ātru tīklu, parasti rāpuļprogrammām ir augstas prasības tīkla kvalitātei, mēģiniet neizmantot mājas tīklu, izvēlēties uzņēmuma tīklu vai iegādāties serveri, lai iegūtu datus.

3: Izvēlieties efektīvāku rāpuļvalodu, es dzirdēju, ka python ir labāks rāpuļprogrammās, bet es to neesmu izmantojis, un es to pārbaudīšu vēlāk, šodien, es to galvenokārt izskaidroju .net valodā.

0x04

Tādām lietām kā steidzīga pirkšana, prasības satveršanas ātrumam ir augstas, to var raksturot kā laika jautājumu, agri iegūt datus, palielināt iespēju satvert, sekojošais ir Es uzrakstīju demonstrāciju ar konsoli, šīs vietnes datu satveršanas testu, kā parādīts zemāk redzamajā attēlā:


(Jo īsāks laiks, jo ātrāk)

Iepriekš minētais datu rangs:1: Vietējais optimizētais kods, 2: Vietējais kods, 3: Trešās puses spraudņu dlls (pakotnes)

0x05

Kāpēc trešo pušu spraudņi (pakotnes) aizņem visilgāko laiku? Trešo pušu spraudņi faktiski ir liels skaits vietējā koda iekapsulējumu, liels skaits loģisku spriedumu un salīdzinoši daudzpusīgs, kas var izraisīt lēnu pārmeklēšanas ātrumu.

Šeit ir vietējais kods:



Vietējais kods ir tikai dažas rindiņas augstāk.Vidējais laiks joprojām ir 184 milisekundes,Jo vienkāršāks kods, jo grūtāk to optimizētVai jūs domājat, ka kā iepriekš minēto kodu var optimizēt, lai sasniegtu vidējo laiku 99 milisekundes?Ātruma starpība ir divkāršota!

0x06

Ja mērķa resursu serveris atbalsta gzip saspiešanu, kad mēs piekļūstam vietnei un pārlūkprogramma pieprasa vietni, pieprasījuma galvenei būs šādi parametri:

Atbildes galvenes parametri:






Ievads "Akceptēšanas kodējumā": https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Accept-Encoding

Nespeciālistu izteiksmē:

Klients saka:Es atbalstu saspiešanas algoritmu "gzip, deflate, sdch, br", atgriežot datus, varat izmantot visu, ko vēlaties.

Serveris teica:Es atbalstu gzip saspiešanas algoritmu, tāpēc es izmantošu gzip algoritmu, lai saspiestu datus jums

Klients saka:Labi, tad es atšifrēšu saņemtos datus ar gzip algoritmu

gzip algoritms, kas var saspiest pārsūtītos datus un ievērojami samazināt pārraidīto saturu, tāpēc pieprasījuma efektivitāte tiks uzlabota, tāpēc optimizētais kods ir šāds:


Lai gan tā ir maza detaļa, var teikt, ka efektivitāte ir divkāršota! Tas ir līdzvērtīgs divu dienu laikā savāktajiem datiem, un tagad tos var savākt 1 dienas laikā, un šis raksts ir veltīts draugiem, kuri mācās rāpot.

Piezīme: gzip saspiešanas algoritmam nav nekāda sakara ar programmēšanas valodu!

Visbeidzot, pievienojiet avota kodu:

Tūristi, ja vēlaties redzēt šīs ziņas slēpto saturu, lūdzuAtbildi

Vērtējums

Dalībnieku skaits2MB+1 Veicināt+2 Sakļaut iemesls
Savienojumi + 1 Ļoti spēcīgs!
Mazliet iesācējs, kuram patīk mācīties + 1 + 1 Atbalstiet īpašnieku, lai ievietotu labu ziņu, un es arī ievietošu labu ziņu!.

Skatīt visus vērtējumus





Iepriekšējo:Iznāk starptautiskās prakses jaunpienācēju ziņojumi
Nākamo:.net/c# nākamās paaudzes CAPTCHA atpazīšanas sistēmas 2.3 apmācība
Publicēts 31.12.2019 10:48:25 |
Xiaobai nevarēja ievainot. Vai ir kāda programmatūra, kas līdzīga lielo datu vākšanai ar vienu klikšķi?
Publicēts 10.06.2019 14:11:09 |
Xiaobai nevarēja ievainot. Vai ir kāda programmatūra, kas līdzīga lielo datu vākšanai ar vienu klikšķi?
Publicēts 15.10.2019 10:29:57 |
GANJUETINGHAOWANDE KANN
Publicēts 20.04.2018 12:35:21 |
Paldies, ka dalījāties
Publicēts 25.04.2018 11:33:55 |
Kolekcija, varbūt noderīga.
Publicēts 17.05.2018 18:02:21 |
Ceļš uz tīmekļa rāpuļprogrammu optimizācijas kolekciju
Publicēts 18.05.2018 16:10:57 |
oooo
Publicēts 18.07.2018 14:43:07 |
Pārbaudiet, vai tas darbojas
Publicēts 20.07.2018 10:09:50 |
DADASDSADSAD
Publicēts 13.08.2018 13:06:50 |
Pārbaudiet šo avota kodu
Publicēts 20.08.2018 14:00:52 |

Paldies, ka dalījāties
Publicēts 30.08.2018 11:42:26 |
srkskrskrskrskrskr
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com