Создаем парсер на Python

Информация:
Тема в разделе "Дизайн и креатив", создана пользователем Collab_Bot, 18 сен 2016.
Этап:
Набор участников
Цена:
398.00 RUB
Участников:
0 из 10
Организатор:
Отсутствует
0%
Расчетный взнос:
53 RUB
  • (Основной список пока пуст)

  1. Collab_Bot

    Collab_Bot Бот рескладчин Бот форума
    • 3063/3811

    Сообщения:
    80.951
    Репутация:
    0
    Отдано:
    1 ГБ
    Скачано:
    0 байт
    Рейтинг:
    -
    Приветствую!

    О чем эта складчина?
    В сети все больше и больше появляются сайты с курсами, презентациями и прочим обучающем и развлекающим контентом. Все это работает по системе подписки. Что порою совсем не выгодно, учитывая кол-во курсов и ограниченное время. Единственное, что остается - выкачать курсы для просмотра оффлайн. Но в 99% случаях ресурсы не дают этого сделать человеческим способом, а скачивать вручную процесс достаточно долгкий, особенно если курсы исчисляются тысячами, как на lynda.com. Поэтому необходимо автоматизировать процесс.

    В этой складчине мы рассмотрим процесс создании парсера на python. Именно такие парсеры работают на складчинах lynda.com, safari books, linuxacademy, cartoonsmart и т.д. В качестве примера рассмотрим сайт lynda.com и сделаем функциональный загрузчик курсов.

    Для кого эта складчина?
    Складчина рассчитана на людей с начальным уровнем программирования. Синтаксис питона достаточно прост, поэтому на нем внимание заострено не будет. Но подробно разберем необходимые нам библиотеки, как встроенные, так и внешние.

    Но... в интернете есть большое количество бесплатных уроков...
    Да, это так. Но, к сожалению, человеку который никогда не сталкивался с парсерами, открытые уроки мало чем помогут. В них описан процесс парсинга сферического сайта в вакууме, например, википедии, достаточно простых страниц. Этого достаточно, чтобы получить данные о курсах валют или погоду своего города, но недостаточно, чтобы выгружать курсы и проходить защиты ресурсов.

    Что полезного в этом курсе?
    • Мы построим полноценное консольное приложение от и до.
    • Научимся работать с аргументами консольного приложения и напишем различные настройки под разные случаи парсинга.
    • Рассмотрим авторизацию, и какие сюрпризы нам могут преподнести.
    • Вскроем страницы и узнаем, как достать нужную нам информацию.
    • Напишем простой, но эффективный менеджер загрузок
    • Поработаем с файловой системой
    • Изучим альтернативные способы парсинга
    • Домашнее задание с поддержкой
    • и много других мелочей

    Бонусы
    50 складчиков - загручик субтитров lynda.com
    100 складчиков - методы борьбы с drm стримингом на примере linuxacademy + использование внешних загрузчиков (аля ffmpeg)
    150 складчиков - полноценный пример парсера для linuxacademy


    Формат: текстовый
    Стоимость: 199 руб.

    Внимание! В рамках данного курса не предусмотрена поддержка по установке и настройке python.



    Это рескладчина на
    Ознакомьтесь с правилами проведения и участия в рескладчинах!
     
    Загрузка...