Тази статия е огледална статия за машинен превод, моля, кликнете тук, за да преминете към оригиналната статия.

Изглед: 106044|Отговор: 24

[WinForm] ASP.NET уеб краулър

[Копирай линк]
Публикувано в 6.11.2017 г. 18:36:20 ч. | | | |
Много краулъри в интернет са написани на python, а преди време беше написан и aps.net прост краулър, който може да обхожда данните, които искате да обходите. В наши дни много уебсайтове са създали механизъм за връщане на краулинга, който прави много трудно за краулърите да събират данни. Вероятно има няколко начина за обратен преглед на повечето уебсайтове: има кодове за верификация, IP адреси, черни списъци и т.н., както и някои по-напреднали методи за обратен обход.
Този краулър е предприел и мерки за справяне с анти-краулиране, заобикаляне на кодове за верификация, използване на проксита и др., поставете част от кода по-долу, обсъждайте и учете с вас, моля, коригирайте какво не е наред!
Този краулър е насочен основно към определен уебсайт.

След като въведете URL адреса, можете да върнете данните според URL адреса и след това да филтрирате и почистите данните през XPath, за да получите желаните данни
За да избегнете backcrawling, можете да използвате прокси IP за достъп, да изтеглите или вземете IP с високо скрит достъп от интернет и след това случайно да превключите прокси IP-то, за да го вземете.
Горният код първо трябва да определи дали превключваният IP адрес е достъпен
Погледнете изходния код за конкретния код и го предоставени!

Изтегляне на изходния код
Туристи, ако искате да видите скритото съдържание на този пост, моляОтговор

Резултат

Брой участници3MB+3 допринасям+3 Срив причина
Малък начинаещ, който обича да учи + 1 + 1 Много мощно!
моксуан + 1 + 1 Подкрепете наемодателя да публикува добър пост
Малък боклук + 1 + 1 Много мощно!

Вижте всички оценки





Предишен:{:1_7:} {:1_9:}
Следващ:Нулиране на средата за разработка vs2017
 Хазяин| Публикувано в 7.11.2017 г. 9:30:14 ч. |
Публикувано на 2017-11-6 18:44
Подредих съдържанието на публикацията за теб

Благодаря, просто исках да изтрия дубликат! Благодаря ви за упоритата работа!
Публикувано в 13.12.2019 г. 10:32:09 ч. |
Искам да знам каква е тази процедура, която написа, човече.
Публикувано в 6.11.2017 г. 18:44:57 ч. |
Подредих съдържанието на публикацията за теб   
Публикувано в 7.11.2017 г. 15:00:04 ч. |
Благодаря, че сподели, нека разгледаме
Публикувано в 8.11.2017 г. 15:46:42 ч. |
Първо погледнете изходния код
Публикувано в 10.11.2017 г. 17:14:31 ч. |
ASP.NET уеб краулър
Публикувано в 8.12.2017 г. 22:15:43 ч. |
Научи се да учиш
Публикувано в 10.12.2017 г. 8:25:22 ч. |
ASP.NET уеб краулър е добра идея!
Публикувано в 23.12.2017 г. 20:54:35 ч. |
ASP.NET уеб краулър
Публикувано в 16.04.2019 г. 11:46:03 ч. |
Благодаря, че сподели, научи се от това.
Отричане:
Целият софтуер, програмни материали или статии, публикувани от Code Farmer Network, са само за учебни и изследователски цели; Горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай потребителите ще понесат всички последствия. Информацията на този сайт идва от интернет, а споровете за авторски права нямат нищо общо с този сайт. Трябва напълно да изтриете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето. Ако ви харесва програмата, моля, подкрепете оригинален софтуер, купете регистрация и получете по-добри услуги. Ако има нарушение, моля, свържете се с нас по имейл.

Mail To:help@itsvse.com