Обновленный Selenium и работа с прокси | Python, Selenium и proxy | Подмена IP адреса

PythonToday
10 Mar 202407:24

Summary

TLDRВ этом видео на канале Python, today мы узнаем, как использовать Selenium с прокси, как с аутентификацией, так и с привязкой к IP-адресу, без использования сторонних модулей. С появлением версии Selenium 4.11 процесс работы с вебдрайверами стал проще, так как теперь не требуется скачивание и указание пути к драйверу. Видео покажет, как настроить Selenium для работы с прокси через пример создания функций для управления ChromeDriver, а также как использовать прокси с аутентификацией и без неё, используя сервис Proxy 6. Также обсуждается использование пользовательских агентов для улучшения парсинга. Коды и дополнительные материалы доступны в Telegram-канале и на GitHub.

Takeaways

  • 😀 Видео учебник по работе с Selenium через прокси с аутентификацией и без, используя только встроенные средства Selenium, без сторонних модулей.
  • 🌐 С версии 4.11 Selenium обновился, и теперь не требуется скачивать WebDriver отдельно – все происходит автоматически.
  • 🔒 Объясняется, как использовать прокси, привязанные к IP-адресу без аутентификации, через сервис Proxy 6, с возможностью покупки прокси на любой срок.
  • 📝 Показано, как создать функцию `GetChromeDriver` для настройки прокси и User-Agent в Selenium.
  • 💡 Приведен пример работы с условием, чтобы добавить прокси и User-Agent в опции браузера при помощи Selenium.
  • 🌍 Рассказано о методе автоматизации для проверки работы прокси, отправляя WebDriver на сайт для проверки IP-адресов.
  • 🛠 Демонстрация использования прокси с аутентификацией, включая создание необходимых переменных и файлов для авторизации.
  • 📦 Объяснение процесса создания ZIP-файла с плагином для Chrome, включая файлы manifest.json и background.js, с деталями для подключения прокси.
  • ✅ Подробное описание добавления расширения (ZIP-файла с плагином) в Chrome через Selenium для работы с аутентифицированным прокси.
  • 📚 Упоминается доступ к дополнительным материалам, скриптам, библиотекам и документации через Telegram-канал и GitHub.
  • 👍 Видео призывает к общению в комментариях, подписке на канал и активности, подтверждая ценность предоставленной информации.

Q & A

  • С какой версии Selenium не требуется скачивать вебдрайвер вручную?

    -Начиная с версии 4.11.

  • Какой сервис прокси использует автор видео?

    -Автор использует сервис Proxy 6.

  • Можно ли использовать Selenium с прокси без аутентификации?

    -Да, можно использовать прокси без аутентификации, если прокси привязан к IP адресу.

  • Какие модули кроме Selenium были упомянуты в видео?

    -Были упомянуты модули zipfile, time и os.

  • Как создать объект класса ChromeOptions?

    -Создание объекта класса ChromeOptions происходит путем инициализации объекта и добавления в него опций через метод add_argument.

  • Для чего используется параметр 'useProxy' в функции get_chrome_driver?

    -Параметр 'useProxy' используется для указания, нужно ли использовать прокси. Если да, то флаг выставляется в True.

  • Как автор видео рекомендует подменять User Agent?

    -Автор рекомендует создавать список из нескольких User Agents и рандомно подставлять один из них.

  • Как передать купленный прокси в Selenium?

    -Прокси передается в Selenium через добавление его в опции ChromeOptions с помощью метода add_argument.

  • Какие файлы необходимы для использования прокси с аутентификацией в Selenium?

    -Необходимы конфигурационные файлы для создания расширения браузера: manifest.json и background.js.

  • Как автор видео тестирует работу прокси?

    -Автор тестирует работу прокси, отправляя драйвер на сайт для проверки IP адресов и добавляя паузу для наблюдения результата.

Outlines

00:00

🔧 Работа с Selenium через прокси

В этом видео рассказывается о том, как использовать Selenium с прокси серверами, как с аутентификацией, так и с привязкой по IP адресу, без использования сторонних библиотек. Упомянуто обновление Selenium до версии 4.11, которое упрощает работу с вебдрайверами, делая процесс более автоматизированным. Представлен обзор сервиса Proxy 6 для покупки прокси и привязки их к IP адресу, а также создание функции для настройки Chrome с использованием прокси и пользовательских агентов для парсинга и обхода блокировок.

05:00

📦 Создание и использование расширения для прокси с аутентификацией

Обсуждается процесс создания расширения для Chrome, позволяющего использовать прокси с аутентификацией в Selenium. Подробно описывается процесс создания двух ключевых файлов: manifest.json и background.js, необходимых для работы расширения, а также способ их компиляции в zip файл с последующей загрузкой в опции Chrome драйвера. Видео демонстрирует успешное применение расширения для работы с аутентифицированными прокси, а также призывает зрителей присоединиться к сообществу канала в Telegram для доступа к дополнительным ресурсам и коду.

Mindmap

Keywords

💡Селениум

Селениум (Selenium) - это инструмент для автоматизации действий веб-браузера. В контексте видео, рассматривается использование Selenium для работы с веб-драйвером и прокси, что позволяет автоматизировать веб-браузинг с определёнными настройками приватности. Пример использования Селениума в видео - это автоматическая установка и настройка веб-драйвера, а также работа с прокси.

💡Прокси

Прокси - это посредник между пользователем и интернет-ресурсом, который может использоваться для анонимности в интернете, обхода блокировок или смены IP-адреса. В видео обсуждается, как использовать Selenium для работы через прокси как с аутентификацией, так и привязанными к IP адресу, что позволяет скрывать реальный IP адрес пользователя.

💡Веб-драйвер

Веб-драйвер - это компонент, позволяющий взаимодействовать с веб-браузером на низком уровне. В контексте видео, Selenium использует веб-драйвер для автоматизации действий в браузере. Обсуждается упрощение процесса работы с веб-драйверами в новых версиях Selenium, когда не требуется вручную загружать и указывать путь к драйверу.

💡IP-адрес

IP-адрес - это уникальный адрес устройства в интернете, который используется для идентификации и взаимодействия с другими устройствами. В видео обсуждается использование прокси для изменения IP-адреса, что позволяет скрыть реальное местоположение пользователя и обойти региональные ограничения.

💡Аутентификация

Аутентификация - процесс проверки подлинности пользователя путём сравнения введённых им данных с данными, хранящимися в системе. В видео рассматривается использование прокси с аутентификацией для доступа к определённым ресурсам через Selenium, что требует передачи логина и пароля.

💡Привязка к IP

Привязка к IP - это настройка прокси сервера, при которой доступ к прокси разрешен только с одного или нескольких определенных IP-адресов. В видео упоминается использование прокси, привязанных к IP-адресу пользователя, что позволяет использовать их без дополнительной аутентификации.

💡Proxy 6

Proxy 6 - это сервис, предлагающий прокси сервера с различными географическими настройками и возможностями аутентификации. В видео этот сервис упоминается как надёжный инструмент для работы с прокси, используемый автором видео на протяжении нескольких лет.

💡ChromeOptions

ChromeOptions - это класс в Selenium, который позволяет настраивать различные параметры для запуска веб-браузера Chrome. В контексте видео, через ChromeOptions происходит добавление прокси и изменение юзер-агента, что позволяет кастомизировать сессию браузера для конкретных задач.

💡Юзер-агент

Юзер-агент - это строка, которая идентифицирует браузер и операционную систему пользователя при обращении к веб-серверам. В видео обсуждается изменение юзер-агента через Selenium и ChromeOptions для имитации различных устройств и браузеров при веб-скрапинге.

💡ZIP-файл с плагином

ZIP-файл с плагином - это архив, содержащий файлы для расширения браузера, используемого для настройки прокси с аутентификацией в Selenium. Видео демонстрирует процесс создания такого файла, включая добавление в него конфигурационных файлов manifest.json и background.js, для последующего использования в качестве расширения в Chrome.

Highlights

Приветствие и анонс основной темы обучения работы с Selenium через прокси.

Обновления в Selenium с версии 4.11 облегчают работу с вебдрайверами.

Установка модуля Selenium и импорт необходимых библиотек.

Использование IP V4 Proxy без аутентификации для работы через прокси.

Рекомендация сервиса Proxy 6 для покупки прокси.

Создание функции GetChromeDriver с возможностью выбора использования прокси и подмены User Agent.

Добавление прокси сервера и User Agent в опции Chrome через условие.

Тестирование работы прокси через Selenium на сайте для проверки IP адресов.

Обзор использования прокси с аутентификацией в Selenium.

Создание конфигурационных файлов для расширений Chrome.

Описание процесса создания zip файла с плагином для Chrome.

Использование созданного плагина для аутентификации через прокси в Selenium.

Подведение итогов и приглашение к дальнейшему изучению и практике.

Призыв подписаться на канал и присоединиться к коммьюнити.

Благодарности за просмотр и пожелания здоровья.

Transcripts

play00:11

друзья Всем привет Вы на канале Python

play00:14

today и сегодня мы научимся работать с

play00:16

селениум через прокси как с

play00:18

аутентификацией так и привязанными к IP

play00:20

адресу без использования сторонних

play00:22

модулей таких как селению Wi похожее

play00:25

видео уже было на канале но мне очень

play00:27

часто пишут в комментариях с данным

play00:29

вопросом селениум обновился и с версии

play00:32

4.11 благодаря встроенному менеджеру нам

play00:35

больше не нужно качать вебдрайвер и

play00:37

указывать до него путь всё происходит

play00:39

автоматически и гораздо проще чем ранее

play00:42

поехали установим модуль селениум

play00:47

импортируем вебдрайвер

play00:50

а также модули zipfile Time и

play00:56

АС для начала рассмотрим вариант с

play00:58

привязкой к IP адресу су прокс что

play01:00

позволяет пользоваться кми без

play01:03

аутентификации в работе я использую IP

play01:05

V4 Proxy уже несколько лет являюсь

play01:08

клиентом сервиса Proxy 6 Где в пару

play01:10

кликов Вы можете купить прокси с

play01:12

огромным выбором стран на любой срок

play01:14

вкус и цвет а также возможностью сразу

play01:17

привязать к IP адресу компьютера если

play01:19

это требуется ссылка на сервис и

play01:21

промокод будут в описании не реклама

play01:24

использую сервис более 5 лет прокси

play01:26

стабильные быстрые позволили мне

play01:28

заработать не тележку шекелей и ни разу

play01:31

не подводили мои проекты создадим

play01:34

функцию Get Chrome

play01:36

dri и пускай она будет принимать два

play01:39

аргумента use Proxy - Это флаг со

play01:41

значением True или fse по дефолту пускай

play01:43

будет Фолс если нам понадобится

play01:45

подменить IP адрес значит флаг будем

play01:48

выставлять в True а если нет то

play01:50

соответственно fse и юзер агент по

play01:52

дефолту равный None его используем для

play01:54

подмены также удобная штука Я часто при

play01:57

парсинге создаю список из нескольких

play01:59

десят

play02:00

а затем рандомно подставляю ведра

play02:03

создадим объект класса Chrome

play02:09

options и напишем условие что если

play02:12

параметр use Proxy будет равен True то

play02:14

есть мы будем использовать Проси то

play02:16

добавляем в опции наш прокси сервер

play02:18

используя функцию Add argument в

play02:20

параметры передаём купленную прок и

play02:25

пор для этой Проси мы выставили привязку

play02:28

по IP адресу личного кабинета Proxy 6

play02:31

просто добавив наш IP в список

play02:33

разрешённых аналогичные условия напишем

play02:35

для проверки юзер Агента и также

play02:38

добавляем его в качестве аргумента к

play02:40

нашим

play02:45

опция инициализирует драйвера

play02:48

обратившись к классу Chrome в параметры

play02:51

которого передаём заданные нами опции

play02:54

после наша функция возвращает объект веб

play02:57

драйвера с уже заданными опциями в

play02:59

зависимости пере аргументов создадим

play03:02

функцию M вызываем в ней нашу

play03:06

функцию с параметром use Pro равному р

play03:09

Агент пока не трогаем и попробуем

play03:11

отправить драйвер на один из сайтов по

play03:13

проверке IP

play03:17

адресов добавим паузу чтобы мы могли

play03:19

увидеть результат и после завершим

play03:22

работу

play03:24

драйвера пром

play03:26

условие в котором вызываем

play03:28

функцию что-то непонятно по функции Main

play03:31

и условию ifname равно Main посмотрите

play03:33

видео по всплывающей подсказке Давайте

play03:36

тестировать запускаем

play03:41

скрипт и Вуаля мы где-то под вашингтоном

play03:45

Обратите внимание юзер Агент Мой

play03:48

попробуем добавить Рандомный от

play03:56

Windows запускаем код ещё

play03:58

раз

play04:03

всё супер юзер Агент сменился наш код

play04:06

работает но Давайте приступим к самому

play04:08

интересному Как использовать прокси с

play04:10

аутентификацией внутри селениум первым

play04:12

делом создадим четыре переменные под IP

play04:22

адрес

play04:24

порт и логин пароль для авторизации

play04:27

чтобы не светить свои логин пароль я

play04:31

импортируют передать свои в качестве

play04:34

строки все данные отобразятся у вас в

play04:36

личном кабинете После

play04:41

покупки далее нам понадобится два файла

play04:44

собственно это конфигурационные файлы

play04:46

которые используются при создании

play04:48

расширений для браузера мы не будем их

play04:50

создавать отдельно а Запишем в

play04:52

переменные чтобы не тратить ваше время я

play04:54

скопирую и вставлю код переписывать с

play04:56

экрана конечно не нужно всё вместе вы

play04:58

можете скачать в на нашем Telegram

play05:00

канале или на гитхабе по ссылке в

play05:02

описании первый файл manifest Jon этот J

play05:05

файл является точкой входа для Chrome

play05:07

для чтения расширения в нём описывается

play05:09

служебная информация версия разрешение

play05:12

скрипт который мы собственно будем

play05:14

исполнять и минимальная версия

play05:16

используемая в

play05:17

работе Второй файл JavaScript с

play05:20

настройками нашего прокси и функциями

play05:22

передачи в браузер дополнительно

play05:23

передаём в него созданные нами ранее

play05:26

переменные OST пор и данные для

play05:28

аутентификации

play05:30

закомментировать

play05:32

с Proxy без аутентификации если мы будем

play05:35

использовать Proxy то нам нужно создать

play05:37

zip файл с плагином внутри которого

play05:40

будут JS и JS файлы manifest.js и

play05:43

background.js содержимое которых мы

play05:45

описали выше первым делом зададим имя

play05:48

для файла с

play05:52

плагином далее используем контекст на

play05:54

Manager WS и объект класса zipfile из

play05:57

модуля zipfile запишем файлы в архив

play06:00

первым параметром передаём имя файла а

play06:02

вторым FL W для

play06:05

записи используем метод wr

play06:08

STR первым параметром передаём имя

play06:11

будущего файла manifest.js далее имя

play06:14

созданной наме ране переменной с

play06:16

информацией которая будет записана в

play06:18

файл и то же самое проворачивать с

play06:24

background.js после того как zip файл с

play06:27

плагином будут созданы передаём его в

play06:29

опцию Chrome драйвера с помощью метода

play06:31

Add extension всё просто как в танке Не

play06:34

пугайтесь У вас есть весь код и когда

play06:36

пробежит по нему сами всё станет гораздо

play06:39

понятнее Давайте тестировать запускаем

play06:42

скрипт и добро пожаловать в Америку наш

play06:46

код

play06:47

работает весь код а также огромное

play06:50

количество ништяков включая полезные

play06:52

скрипты библиотеки и документацию к ним

play06:55

Вы можете скачать в нашем Telegram

play06:56

канале присоединяйтесь к коммьюнити по

play06:58

ссылке в описании Надеюсь видео было вам

play07:01

полезным интересным и вы узнали что-то

play07:03

новое и если хотите больше практики и

play07:06

роликов по Python Не забудьте поставить

play07:08

свой лайк подписаться на канал и

play07:10

поделиться мнением или идеями в

play07:11

комментариях Ведь так я понимаю что не

play07:14

зря выкладываю ролики друзья огромное

play07:16

вам спасибо за просмотр Будьте здоровы

play07:19

Всем

play07:23

пока

Rate This

5.0 / 5 (0 votes)

Related Tags
SeleniumПроксиВеб-скрапингPythonАутентификацияIP-адресПрограммированиеОбучениеАвтоматизацияВебдрайвер
Do you need a summary in English?