A-Parser - многопоточный парсер поисковых систем

Тема в разделе "SEO-оптимизация и продвижение сайтов", создана пользователем A-Parser Support, 10 янв 2018.

Метки:
  1. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Продолжение цикла уроков по созданию JavaScript парсеров. В этом видео будет показано, как "на лету" добавлять запросы в задание и многопоточно их обрабатывать.

    В одной из наших

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    мы рассмотрели способ разработки парсера, который собирает ТОП 10 из выдачи поисковика, а затем по очереди парсит нужные данные по полученным ссылкам. Вроде все неплохо, но если у вас не 10 запросов, несколько тысяч? Задание будет выполняться очень долго, а время это самый драгоценный и не восполняемый ресурс.
    К счастью в A-Parser есть такая замечательная вещь, как многоуровневый парсинг, который позволяет многократно увеличить скорость парсинга, и в этом видео мы рассмотрим как этой возможностью пользоваться.

    В этом уроке рассмотрено:
    • Реализация раздельных процедур парсинга в зависимости от внешних условий, а именно - уровня парсинга
    • Подстановка запросов в задание "на лету"
    • Использование стандартных парсеров в кастомных JavaScript парсерах
    Ссылки:
    Оставляйте комментарии и

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    !
     
  2. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    [​IMG]
    Улучшения
    Исправления в связи с изменениями в выдаче
    Исправления
    • Исправлена работа [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

      для некоторых доменных зон
    • Исправлена ошибка, при которой не импортировался пресет, если не установлены модули, используемые в нем
    • Исправлена кодировка при использовании fs.readdirSync в JS парсерах
     
  3. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Данный парсер является примером для разработки парсера работающего с OpenCart. Решение демонстрирует возможность сбора данных о товарах из стороннего сайта и заливку их на собственный сайт на базе OpenCart через API.

    В этом уроке рассмотрены:
    • парсинг товаров из интернет-магазина
    • авторизация в OpenCart
    • работа с API OpenCart для публикации товаров

    Статья и готовый пресет опубликованы в нашем Каталоге:

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!



    Оставляйте комментарии и подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

     
  4. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    [​IMG]
    Улучшения
    Исправления в связи с изменениями в выдаче
    Исправления
     
  5. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Это видео демонстрирует возможность создания полноценного Telegram канала на базе A-Parser. Парсер периодически и без вмешательства пользователя будет собирать контент и публиковать его на канале.

    В уроке рассмотрены:
    • Регистрация и настройка канала в Телеграм.
    • Последовательное выполнение нескольких заданий.
    • Сохранение промежуточных данных в базу SQLite с последующим чтением.
    • Настройка пресета для постинга сообщений в Telegram-канал.
    Статья с подробным описанием процесса создания:

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Ссылки на готовые пресеты:

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Оставляйте комментарии и подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

     
  6. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.
    [​IMG]

    Кроме этого:
    Еще больше различных рецептов в нашем

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Предлагайте ваши идеи для новых парсеров

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    , лучшие будут реализованы и опубликованы.

    Подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .
     
  7. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    [​IMG]
    Улучшения
    Исправления в связи с изменениями в выдаче
    Исправления
    • Исправлена утечка памяти при большом количестве попыток
    • Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
    • Исправлен парсинг различных параметров в [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    • Исправлено отображение русского языка (проблема появилась в предыдущей версии)
    • Исправлено зависание при работе [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

      с антигейтом
    • JS парсеры: исправлена работа check_content
    • JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)
     
  8. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!



    Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.



    В этом уроке показано:
    • краткое содержание предыдущей части
    • запуск созданного пресета
    • демонстрация результатов работы
    Первая часть:

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Статья и готовый пресет опубликованы в нашем Каталоге:

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Оставляйте комментарии и подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    !
     
  9. A-Parser Support

    A-Parser Support Well-Known Member

  10. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    27-й сборник рецептов. В нем собраны рецепты для парсинга списка соискателей на hh.ru, сбора списка юзерагентов и парсинга Авито с записью результатов в MySQL базу данных. Также показан пример отправки файлов в POST запросе. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    HeadHunter - это один из самых популярных ресурсов для поиска работы. Соответственно, сбор списка соискателей может быть интересен рекрутерам для более эффективного анализа потенциальных кандидатов. Готовое решение для парсинга доступно по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Сейчас существует много различных браузеров, которые работают на разных платформах. Многие сайты ограничивают работу со старыми браузерами, а некоторые не отдают контент даже при запросе с юзерагентом относительно нового браузера. В A-Parser можно задавать user-agent для запросов, также существует специальный инструмент, который позволяет при каждом запросе выбирать рандомный из заранее подготовленного списка. Пресет для парсинга таких списков, с возможностью фильтрации по различным параметрам, доступен по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Предыдущий пресет для парсинга Авито пользуется большой популярностью. Также наши пользователи часто спрашивают о возможности записи собранных результатов напрямую в базу данных. Поэтому мы подготовили JS парсер, который решает эту задачу. Как обычно, он доступен по ссылке выше.
    [​IMG]

    Кроме этого:

    Еще больше различных рецептов в нашем

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    !

    Предлагайте ваши идеи для новых парсеров

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    , лучшие будут реализованы и опубликованы.

    Подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .
     
  11. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В данном видео будет сделан краткий обзор некоторых методов API.

    В этом уроке рассмотрены:
    • обзор методов
    • составление JSON для методов ping,info и oneRequest
    • работа с API используя Postman
    Оставляйте комментарии и подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

     
  12. titimiti

    titimiti New Member

    Хороший урок,всё ясно и понятно
     
  13. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    [​IMG]
    В уходящем году одним из приоритетных направлений стало развитие JavaScript парсеров и функционала по работе с Node.js. Одним из финальных этапов стал данный релиз, в котором была реализована долгожданная поддержка https/tls в Node.js модулях. Также усилия были сосредоточены на повышении стабильности и производительности. В результате этого было сделано множество наработок, которые уже в первой половине 2019 года планируется выпустить в виде нового A-Parser 2.0, где будет много новых и крутых возможностей.
    Команда A-Parser поздравляет всех с Новым годом и Рождеством! Мы желаем вам успехов в делах, прибыльных проектов и ярких идей. Пускай Новый 2019 год будет годом новых возможностей, все задуманное сбывается, а работа приносит удовольствие!
    Спасибо что Вы с нами!!!
    В новогоднем релизе, кроме снеговика:), было сделано следующее:
    Улучшения

    Исправления в связи с изменениями в выдаче
    Исправления
     
  14. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.
    [​IMG]

    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .

    Подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .

    Предыдущие сборники статей
     
  15. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    28-й сборник рецептов. В нем будет показан способ автоматизации парсинга данных из Wordstat, пример парсинга информации о приложениях со скидками в Google Play, а также готовое решение для сбора подсказок из Яндекс вместе с их типами. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Периодически в Google Play разработчики предлагают скидки на приложения, иногда на короткий срок платные становятся полностью бесплатными. С помощью A-Parser можно искать подобные предложения. Кроме этого, в этом парсере собирается множество дополнительных данных и используется сохранение в sqlite базу данных, поэтому его можно рассматривать как еще один пример работы с базами данных в А-Парсере. Готовое решение доступно в каталоге по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В A-Parser есть стандартный парсер Яндекс подсказок, который по заданным ключевым словам собирает подсказки. Но Яндекс классифицирует подсказки по различным типам, которые в свою очередь позволяют использовать их более рационально, применяя соответствующие фильтры. Стандартный парсер подсказок не возвращает типы, поэтому по ссылке выше опубликован JS парсер для сбора подсказок вместе с их типами.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В этом парсере реализован автоматический сбор данных из WordStat. При этом, парсер проверяет наличие необходимых для данной задачи аккаунтов, и если требуется - то автоматически регистрирует их. Такое решение может быть полезно для организации периодического парсинга WordStat в автоматическом режиме. Готовое решение - по ссылке выше.
    [​IMG]

    Предлагайте ваши идеи для новых парсеров

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    , лучшие будут реализованы и опубликованы.
    Подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .
     
  16. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    [​IMG]
    Улучшения
    • Улучшение Просмотра логов:
      • Фильтр по неудачным/выполняющимся задачам
      • Сортировка по времени выполнения
      • Поддержка пагинации и поиска по логам
      • Отображение парсера и запроса
    • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
    • Добавлен новый парсер [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

      , который позволяет проверить сайт в блэклисте Яндекса
    • В [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

      реализована возможность сравнивать данные по ключевым словам
    • Улучшения в логике [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    • Улучшена стабильность JavaScript парсеров (движка v8)
    • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
    • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
    • JS парсеры: добавлено кэширование DNS ответов

    Исправления в связи с изменениями в выдаче

    Исправления
    • Исправлена обработка пустых запросов в JavaScript парсерах
    • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
    • Исправлена работа с некоторыми видами прокси
    • Исправлена работа опции Stop when found в [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    • В [​IMG]SE::Yandex при получении ошибки от антигейта не менялись прокси
    • Исправлен парсинг ссылок на потенциально опасные сайты в [​IMG]

      Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
    • JS парсеры: исправлено зависание потоков при использование tls
    • JS парсеры: множественные исправления в работе сокетов
     
  17. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.
    [​IMG]

    Еще больше различных рецептов в нашем

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    !

    Предлагайте ваши идеи для новых парсеров

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    , лучшие будут реализованы и опубликованы.

    Подписывайтесь на

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .
     
  18. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.

    В уроке рассмотрено:
    • Работа с Node.js и Node package manager (npm)
    • Первый запуск npm, установка модулей (пакетов)
    • Использование модулей при создании JS парсера
    • Ресурсы для работы с npm
    Ссылки:
    Оставляйте комментарии и

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

     
  19. A-Parser Support

    A-Parser Support Well-Known Member

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.
    [​IMG]

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!


    Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.
    [​IMG]

    Еще больше различных рецептов в нашем

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    !
    Подписывайтесь на наш

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в

    Что бы просматривать внешние ссылки зарегистрируйтесь или авторизуйтесь на форуме!

    .