Работае с куки (cookies)

Выдержка из википедии
Cookie используются веб-серверами для идентификации пользователей и хранения данных о них.

К примеру, если вход на сайт осуществляется при помощи cookie, то, после ввода пользователем своих данных на странице входа, cookie позволяют серверу запомнить, что пользователь уже идентифицирован и ему разрешён доступ к соответствующим услугам и операциям.

Многие сайты также используют cookie для сохранения настроек пользователя. Эти настройки могут использоваться для персонализации, которая включает в себя выбор оформления и функциональности. Например, Википедия позволяет авторизованным пользователям выбрать дизайн сайта. Поисковая система Google позволяет пользователям (в том числе и не зарегистрированным в ней) выбрать количество результатов поиска, отображаемых на одной странице.

Cookie также используются для отслеживания действий пользователей на сайте. Как правило, это делается с целью сбора статистики, а рекламные компании на основе такой статистики формируют анонимные профили пользователей для более точного нацеливания рекламы.

Работа с Cookie

Если при парсинге вам необходимо работать с куками вы можете это сделать через вкладку браузер.

Для работы с cookies вам необходимо разрешить модулю работать с куками.

После включения этой настройки модуль будет сохранять и отправлять куки, имитируя полноценную сессию как обычный браузер.
Так же у вас доступна настройка Сессионные куки которая позволяет эмитировать новую сессию при каждом запросе.
Эта настройка в совокупности с User-Agent, Headers и прокси позволит обходить любые блокировки на сайте доноре.

Вы можете отправлять свои куки сайту, это полезно когда есть необходимость парсить с помощью авторизации.

Форма записи Куки файлов (Cookie)

год-месяц-день ; Имя куки=Значение
Время указывать необязательно. Можно записывать просто Имя куки=Значение , каждая новая кука должна быть записана с новой строки.

Пример:

1970-01-01 03:00:00 ; PHPSESSID=iu441bmp3jm30vodi9cn22bas4  
language=ru  
1970-01-01 03:00:00 ; currency=UAH  
viewed=1895  

После того как вы нажмете кнопку сохранить модуль запишет все куки что вы хотите отправлять донору.
Модуль сам проставит время для кук которые вы записали без срока окончания. И все такие куки будут считается по умолчанию сессионными.

Авторизация при помощи cookie

Самый простой способ что бы начать парсить как авторизованный пользователь.
Для этого вам необходимо авторизоваться в своем браузере на сайте, я использую браузер Mozilla Firefox и все примеры буду показывать на нем.

  1. После авторизации вам необходимо нажать f2 и браузере откроет меню разработчика.
  2. Перейти на вкладку сеть, и обновить страницу.
  3. После в боковом меню выбрать раздел заголовки и заголовки запроса.
  4. Поставить галочку необработанные заголовки
  5. Скопировать строку начинавшуюся на Cookie:

Считайте у вас готовые куки для парсинга как авторизованный пользователь.
Осталось только вставить эту строку в поле Куки браузера и поделить что бы каждая кука была с новой строки.

После того как вы авторизовались на сайте, вы можете видеть свой логин.

А после того как вы запишите куки в браузер парсера модуль тоже будет работать как авторизованный пользователь и в коде сайта вы обнаружите тоже те данные что доступны только авторизованным пользователям.

Вот так просто в модуле SImplePars вы можете парсить с авторизацией.