Эта статья является зеркальной статьёй машинного перевода, пожалуйста, нажмите здесь, чтобы перейти к оригиналу.

Вид: 10314|Ответ: 1

[Связь] Антикарманные кражи на сайте

[Скопировать ссылку]
Опубликовано 12.07.2019 17:22:08 | | |
1. Заголовок HTTP-запроса

Каждый раз, когда серверу отправляется HTTP-запрос, передаётся набор атрибутов и конфигурационной информации — заголовок HTTP-запроса. Поскольку заголовок запроса, отправленный браузером, отличается от заголовка запроса, отправленного кодом краулера, он, скорее всего, будет обнаружен антикраулером, что приведёт к блокировке IP.

2. Настройки cookie

Сайты отслеживают ваш визит через файлы cookie и немедленно прерывают его при обнаружении поведения краулера, например, при быстром заполнении формы или просмотре большого количества страниц за короткое время. Рекомендуется проверить файлы cookie, создаваемые этими сайтами в процессе сбора сайтов, а затем подумать, с какими из них должен иметь дело краулеру.

3. Путь доступа

Общий путь доступа к краулёру всегда одинаков, и его легко распознать антикраулеры, попытаться имитировать пользовательский доступ и случайно получить доступ к странице.

4. Частота визитов

Большинство причин блокировки IP связаны с тем, что частота доступа слишком высокая, ведь они хотят быстро выполнить задачу краулера, но скорость не достигается, и эффективность снижается после блокировки IP.

Базовая стратегия против краулеров — это, конечно, более строгие антикраулеры, не только они, которые требуют от инженеров постепенного изучения стратегии против краулеров целевого сайта, при постоянном обновлении стратегии краулера также необходимо постоянно обновлять стратегию краулеров, в сочетании с эффективным и качественным прокси-IP, работа краулера может выполняться эффективно.




Предыдущий:SpringBootMainApplication или также для приложения
Следующий:Полная версия вводного учебника по Python (если знаете китайский)
Опубликовано 12.07.2019 19:01:50 |
Краулеры имитируют данные HTTP-запросов, и все антикраулеры одинаковы, чтобы проверить, чей алгоритм умнее и эффективнее. Также необходимо разработать разумную стратегию, исходя из вашей собственной бизнес-ситуации.

Например, на обычном консалтинговом сайте пользователи не могут получить 1 000 запросов за 1 минуту или десятки тысяч запросов за час; если один IP превышает установленный порог, вы можете напрямую отклонить его или перейти на страницу кода верификации, перелистать или ввести код подтверждения, к которому можно получить нормальный доступ снова, иначе IP будет заблокирован.
Отказ:
Всё программное обеспечение, программные материалы или статьи, публикуемые Code Farmer Network, предназначены исключительно для учебных и исследовательских целей; Вышеуказанный контент не должен использоваться в коммерческих или незаконных целях, иначе пользователи несут все последствия. Информация на этом сайте взята из Интернета, и споры по авторским правам не имеют отношения к этому сайту. Вы должны полностью удалить вышеуказанный контент с компьютера в течение 24 часов после загрузки. Если вам нравится программа, пожалуйста, поддержите подлинное программное обеспечение, купите регистрацию и получите лучшие подлинные услуги. Если есть нарушение, пожалуйста, свяжитесь с нами по электронной почте.

Mail To:help@itsvse.com