Import.io — как собрать нужные данные с разных сайтов

Сервис Import.io позволяет вам собирать данные с любого сайта и представлять их в виде таблицы, по которой можно осуществлять поиск информации.

Сервис на днях вышел из закрытого тестирования и теперь работает не только с Windows, но так же на MacOS и других операционных системах.

Система по умолчанию бесплатная, но, по словам разработчиков, в ближайшее время запустятся ряд платных функций, расширяющий базовый функционал.

Работает import.io следующим образом. Вы скачиваете приложение с сайта. В этом приложении есть строка, в которую вы вводите адрес сайта, с которого вам необходимо собрать данные.

Building-an-Extractor.1
Скрин: Journalism.co.uk

Затем вам нужно «научить» систему, откуда брать данные. Вы включаете кнопку «Запись» и проводите курсором на тех блоках сайта, в которых хранятся нужные вам данные.

Затем просто нажимаете кнопку «Train Rows». Для того, чтобы система «научилась», нужно показать три-пять мест с данными на сайте. Теперь import.io знает, что и где искать.

А дальше все данные сохраняются в удобную таблицу, с которой уже можно работать.

Dataset-page
Скрин: Journalism.co.uk

Journalism приводит примеры того, как import.io решал конкретные задачи самым разным организациями и компаниям.

Британский Красный Крест планировал создать приложение для iPhone, которое бы собирало данные с сайта NHS Choices, но проблема была в том, что у этого сайта нет API, который выдавал бы данные по запросу. Поэтому Красный Крест обратился к сервису import.io, который собирает все необходимые данные.

HP озадачились сбором цен на ноутбуки на сайтах интернет-магазинов. Import.io собрал все данные и позволяет мониторить их в режиме реального времени.

Думаем, у каждого из нас бывают подобные задачи, которые можно вот так красиво решать.

Добавить комментарий

Ваш e-mail не будет опубликован.