Архивы сборщики, парсеры, грабберы - Сообщество разработчиков скриптов Human Emulator

Скрипт Human Emulator парсинга HTML-страницы с использованием XPath

В этой статье мы рассмотрим один из примеров написания скрипта для парсинга HTML-страниц с использованием XPath на примере сайта bing.com.

Сперва определимся с тем, что такое XPath и зачем оно нужно, если есть регулярные выражения?

XPath (XML Path Language) — это язык запросов к элементам XML-подобного документа (далее для краткости просто XML).

XPath призван реализовать навигацию по DOM в XML.

Regexp — формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов.

По сути это строка-образец (шаблон), состоящая из символов и метасимволов и задающая правило поиска.

Итак, главная разница в том, что XPath специализируется на XML, а Regexp — на любом виде текста.

В: Зачем использовать XPath, если есть regexp, в котором можно сделать тоже самое?
О: Простота поддержки.

Синтаксис у regexp такой, что уже через неделю может быть проще всё переписать, чем вносить изменения,
а с XPath можно спокойно работать. И синтаксис у xpath довольно компактный,xml’ё-фобы могут быть спокойны.

Простой пример для вдохновения — получим значение атрибута «href» у, например, тега «a».

<a href="https://ya.ru">Yohoho!</a>

Regexp:

<a.*?href=("|')(.*?)("|').*?>

XPath:

"string(//a/@href)"

XPath + PHP:

$dom = new DOMDocument;

// "@" Это, конечно, плохо. Но HTML не обязан быть
// валидным, в отличие от XML.
@$dom->loadHTML("<a href=\"https://ya.ru\">Yohoho!</a>");

$xpath = new DOMXpath($dom);
    
$res = $xpath->query("//a");
    
echo $res->item(0)->getAttribute("href") . PHP_EOL;

<a href="https://ya.ru">Yohoho!</a>

Regexp:

<a.*?href=("|')(.*?)("|').*?>

XPath:

"string(//a/@href)"

XPath + PHP:

$dom = new DOMDocument;

// "@" Это, конечно, плохо. Но HTML не обязан быть

// валидным, в отличие от XML.

@$dom->loadHTML("<a href=\"https://ya.ru\">Yohoho!</a>");

$xpath = new DOMXpath($dom);

$res = $xpath->query("//a");

echo $res->item(0)->getAttribute("href") . PHP_EOL;

Быстро (несколько небольших страниц) пробежаться по основам XPath можно в туториале от W3Schools.

Как использовать XPath в PHP можно почитать в документации на php.net.
И в небольшом тутораильчике от IBM DeveloperWorks.

Теперь определимся с необходимым функционалом скрипта:

* Возможность указывать произвольный поисковый запрос

* Парсим только первую страницу поисковой выдачи

* Из поисковой выдачи нам нужно:

* заголовок

* ссылка

* номер в выдаче

Исходя из нашего ТЗ составляем примерный алгоритм работы скрипта:

1) Заходим на bing.com

2) Вводим поисковую фразу

3) Получаем со страницы необходимый результат

Приступим к написанию парсера поисковой выдачи http://bing.com.
Для начала, создадим базовый каркас скрипта.

    // coding: windows-1251
    // Настройка HumanEmulator
    // -----------------------------------------------
    // Где запущен XHE
    $xhe_host = "127.0.0.1:7010";
    // HumanEmulator lib
    require "../../Templates/xweb_human_emulator.php";
    // Our tools
    require "tools/functions.php";
    
    // Настройки скрипта
    // -----------------------------------------------
    
    // Скрипт
    // -----------------------------------------------
    
    // Quit
    $app->quit();

// coding: windows-1251

// Настройка HumanEmulator

// -----------------------------------------------

// Где запущен XHE

$xhe_host = "127.0.0.1:7010";

// HumanEmulator lib

require "../../Templates/xweb_human_emulator.php";

// Our tools

require "tools/functions.php";

// Настройки скрипта

// -----------------------------------------------

// Скрипт

// -----------------------------------------------

// Quit

$app->quit();

В настройки добавим переменную для хранения поискового запроса.

// Поисковый запрос
$text = "ХуманЭмулятор";

1 2	// Поисковый запрос $text = "ХуманЭмулятор";

Заходим на сайт.

// Базовый URL
$base_url = "https://www.bing.com/?setlang=en";
$browser->navigate($base_url);

// Базовый URL

$base_url = "https://www.bing.com/?setlang=en";

$browser->navigate($base_url);

Вводим поисковую фразу.

$input->set_value_by_attribute("name", "q", true, $text);
sleep(1);
$element->click_by_attribute("type", "submit");
sleep(5);

$input->set_value_by_attribute("name", "q", true, $text);

sleep(1);

$element->click_by_attribute("type", "submit");

sleep(5);

Сохраним в переменную содержимое страницы.

// Получаем содержимое страницы
$content = $webpage->get_body();

1 2	// Получаем содержимое страницы $content = $webpage->get_body();

Настроим xpath-объект:

$dom = new DOMDocument;
@$dom->loadHTML($content);
$xpath = new DOMXpath($dom);

$dom = new DOMDocument;

@$dom->loadHTML($content);

$xpath = new DOMXpath($dom);

Теперь у объекта $xpath есть метод «query» в который мы будем передавать наше xpath-выражение.
Давайте начнём создавать xpath-выражение.
Открыв исходный код страницы с результатами поисковой выдачи увидим, что сами результаты находятся внутри тега «li».

<li class='b_algo'>
<!-- ... -->
</li>

</li>

Т.о. наше xpath-выражение выберет со страницы все поисковые результаты.

$results = $xpath->query("//li[@class=\"b_algo\"]");

1	$results = $xpath->query("//li[@class=\"b_algo\"]");

На одной странице у нас должно быть 1 или больше результатов, проверим себя:

if($results === false)
    {
        echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
        $app->quit();
    }
    elseif($results->length === 0)
    {
        echo "Поисковый запрос '{$text}' не принёс результатов." . PHP_EOL:
        $app->quit();
    }
    echo "Нашли {$results->length} совпадений." . PHP_EOL;

if($results === false)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

elseif($results->length === 0)

{

echo "Поисковый запрос '{$text}' не принёс результатов." . PHP_EOL:

$app->quit();

}

echo "Нашли {$results->length} совпадений." . PHP_EOL;

Здесь стоит обратить внимание на ветку if, где мы сравниваем кол-во результатов xpath-поиска с нулём.
Если наше xpath-выражение ничего не нашло, то это может означать две вещи:

* Bing действительно ничего не нашёл.

* Bing что-то нашёл, но поменял вёрстку на странице, и наше xpath-выражение необходимо исправлять.

2-й пункт достаточно коварный, в таких случаях, когда xpath-выражение ничего не находит необходимо дополнительно
сверятся, чтобы удостоверится, что xpath-выражение не устарело (хотя и это не даст 100% гарантий).

В нашем случае будем сверяться с тем, что Bing пишет кол-во найденных результатов.

<span class="sb_count" data-bm="4">14 results</span>

1	<span class="sb_count" data-bm="4">14 results</span>

А если результатов по поисковому запросу нет, то:

<li class="b_no" data-bm="4">
<h1>No results found for ...</h1>
<!-- ... -->
</li>

<h1>No results found for ...</h1>

</li>

Т.о. мы получаем такую конструкцию проверки:

— Если xpath-запрос ничего не нашёл и поисковый запрос ничего не нашёл, то на странице будет html-код с «No results found».

— Если xpath-запрос ничего не нашёл, а поисковый запрос что-то нашёл, то на странице будет html-код с «N results».

Обновим проверку результата xpath-запроса.

if($results === false)
    {
        echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
        $app->quit();
    }
    elseif($results->length === 0)
    {
        // Если bing ничего не нашёл
        $check_results1 = $xpath->query("//li[@class=\"b_no\"]");
        // Если bing что-то нашёл
        $check_results2 = $xpath->query("//span[@class=\"sb_count\"]");
        
        if($check_results1 === false or $check_results2 === false)
        {
            echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
            $app->quit();
        }
        
        if($check_results1->length > 0 and $check_results2->length === 0)
        {
            echo "Поисковый запрос '{$text}' не принёс результатов." . PHP_EOL:
            $app->quit();
        }
        else
        {
            echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
            $app->quit();
        }
    }
    else
    {
        echo "Нашли {$results->length} совпадений для '{$text}' на 1-й странице поисковой выдачи." . PHP_EOL;
    }

if($results === false)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

elseif($results->length === 0)

{

// Если bing ничего не нашёл

$check_results1 = $xpath->query("//li[@class=\"b_no\"]");

// Если bing что-то нашёл

$check_results2 = $xpath->query("//span[@class=\"sb_count\"]");

if($check_results1 === false or $check_results2 === false)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

if($check_results1->length > 0 and $check_results2->length === 0)

{

echo "Поисковый запрос '{$text}' не принёс результатов." . PHP_EOL:

$app->quit();

}

else

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

else

{

echo "Нашли {$results->length} совпадений для '{$text}' на 1-й странице поисковой выдачи." . PHP_EOL;

}

Если всё хорошо и что-то нашлось, то у нас в $results будет N сущностей с результатами отработки xpath-запроса.

Каждая сущность будет содержать такой HTML-код

  <div class="b_title">
    <h2>
      <a h="ID=SERP,5082.1" href="http://www.armadaboard.com/topic25915.html">
        Для чего нужен <strong>Хуман Эмулятор</strong>? &gt; …
      </a>
    </h2>
    
    <!-- // ... -->
  </div>

<h2>

Для чего нужен <strong>Хуман Эмулятор</strong>? > …

</a>

</h2>

</div>

Теперь можно приступить непосредственно к выборке интересующих нас данных.

foreach($results as $num => $item)
    {
        // В $item у нас сущность с одним результатом из поисковой выдачи
    }

foreach($results as $num => $item)

{

// В $item у нас сущность с одним результатом из поисковой выдачи

}

Получаем номер в поисковой выдаче.

echo "Номер в поисковой выдаче: " . ($num + 1) . PHP_EOL;

1	echo "Номер в поисковой выдаче: " . ($num + 1) . PHP_EOL;

Получаем заголовок.

$title = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);
    if($title === false or $title->length !== 1)
    {
        echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
        $app->quit();
    }
    $title = utf8_decode($title->item(0)->textContent);
    echo "Заголовок: '{$title}'" . PHP_EOL;

$title = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);

if($title === false or $title->length !== 1)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

$title = utf8_decode($title->item(0)->textContent);

echo "Заголовок: '{$title}'" . PHP_EOL;

В данном случае мы в метод «query» передали вторым параметром текущий $item и в xpath-запросе не указывали «//» (т.е. искать сначала страницы).

2-й параметр означает контекст поиска для xpath-запроса, т.е. искать будем не по всей странице, а только по маленькому html-кусочку из $item.
И, наконец-то, получаем ссылку.

$link = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);
    if($link === false or $link->length !== 1)
    {
        echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
        $app->quit();
    }
    $link = $link->item(0)->getAttribute("href");
    echo "Ссылка: '{$link}'" . PHP_EOL;

$link = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);

if($link === false or $link->length !== 1)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

$link = $link->item(0)->getAttribute("href");

echo "Ссылка: '{$link}'" . PHP_EOL;

Вообще-то, ссылку можно было получить и без совершения дополнительного xpath-запроса, использовав результат из поиска заголовка.
Но оставим так, для наглядности.

    // Получаем заголовок и ссылку
    //
    $title_link = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);
    if($title_link === false or $title_link->length !== 1)
    {
        echo "С нашим xpath-выражением что-то не так." . PHP_EOL;
        $app->quit();
    }
    $title = utf8_decode($title_link->item(0)->textContent);
    echo "Заголовок: '{$title}'" . PHP_EOL;
    $link = $title_link->item(0)->getAttribute("href");
    echo "Ссылка: '{$link}'" . PHP_EOL;

// Получаем заголовок и ссылку

$title_link = $xpath->query("div[contains(@class, \"title\")]/h2/a", $item);

if($title_link === false or $title_link->length !== 1)

{

echo "С нашим xpath-выражением что-то не так." . PHP_EOL;

$app->quit();

}

$title = utf8_decode($title_link->item(0)->textContent);

echo "Заголовок: '{$title}'" . PHP_EOL;

$link = $title_link->item(0)->getAttribute("href");

echo "Ссылка: '{$link}'" . PHP_EOL;

Полезные ссылки:

Wikipedia XPatch
Wikipedia Rugular expression
W3.org XPatch
W3schools XPatch
Mozilla.org XPatch
PHP.net
Ibm.com x-xpatch
Ibm.com x-xpatchphp

Скрипт написан 28.04.2015 в Human Emulator 4.9.18 Advanced.

скачать скрипт

Скрипт Human Emulator cборщик трастовых сайтов для размещения активных ссылок

Предлагаем вашему вниманию скрипт сборщик трастовых сайтов. Этот скрипт в очень короткие сроки соберёт для вас базу трастовых сайтов, на которых можно оставить активную ссылку. Для того что бы собрать эту базу нам понадобится любой чужой прогнанный сайт. Найти такие сайты в сети не представляет труда. Главное подобрать свеже прогнанный сайт.

Так же с помощью этого скрипта можно посмотреть активность любого интересующего вас сайта в яндекс за любой промежуток времени.

Собственно в чём фишка. Мы берём подобранный нами сайт и вводим в яндекс такой вот запрос — «http://site.ru» date:20110901..20111020. В выдачу яндекс выдаст все последние проиндексированные ссылки, которые появились в интрнете за заданный промежуток времени. Мы получаем все страницы, на которых стоят эти ссылки. Далее скрипт парсит выдачу яндекса. Теперь у нас есть ссылки из выдачи, далее проверяем их Тиц и удаляем ненужные, а затем проверяем оставшиеся ссылки на наличие обратной кликабельной ссылки. Опять таки удаляем лишнее. Вот и всё база готова.

Настройки скрипта:

PHP

// сайт по которому ищем ссылки $search_site="интересующий нас сайт"; // запрос для поиска ссылок для заданного сайта и временной диапозон $search_string="\"http://$search_site\" date:20120301..20120716"; // разделитель для результатов $separator="\n"; // ограничение по тиц - здесь задаём интересующий нас ТИЦ $tz_limit=0; // удалить ссылки с нулевым тиц // глубина прохода в поисковые результаты $cnt_pages = 15; $crnt_page =1; - страница выдачи яндекс с которой начинать разбор ссылок

1
2
3
4
5
6
7
8
9
10
11
12
13

// сайт по которому ищем ссылки
$search_site="интересующий нас сайт";
// запрос для поиска ссылок для заданного сайта и временной диапозон
$search_string="\"http://$search_site\" date:20120301..20120716";

// разделитель для результатов
$separator="\n";
// ограничение по тиц - здесь задаём интересующий нас ТИЦ
$tz_limit=0; // удалить ссылки с нулевым тиц

// глубина прохода в поисковые результаты
$cnt_pages = 15;
$crnt_page =1; - страница выдачи яндекс с которой начинать разбор ссылок

Собственно сам скрипт:

PHP

$xhe_host ="127.0.0.1:7011"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // /////////////////////////// настройки /////////////////////////////////////////////// // сайт по которому ищем ссылки $search_site="интересующий нас сайт"; // запрос для поиска ссылок для заданного сайта и временной диапозон $search_string="\"http://$search_site\" date:20120301..20120716"; // разделитель для результатов $separator="\n"; // ограничение по тиц $tz_limit=0; // удалить ссылки с нулевым тиц // глубина прохода в поисковые результаты $cnt_pages = 15; $crnt_page =1; // режим отладки $dbg=true; // //////////////////////// дополнительные модули ///////////////////////////// // основные функции require_once("functions.php"); // ////////////////////////// скрипт ////////////////////////////////////////////////////// // navigate to google $browser->navigate("http://www.ya.ru"); // задать в поиск $input->set_value_by_name("text",$search_string); // искать $button->click_by_number(0); // разберём данные $res_urls = ya_parse($separator); // если нет ссылок останавливаем скрипт if($res_urls=="") { debug_mes("нет ссылок!!!"); $app->quit(); } // переходим на проверку тиц $browser->navigate("http://www.raskruty.ru/tools/cy/"); // зададим urls $textarea->set_inner_text_by_name("urrrls",$res_urls); // проверим $button->click_by_inner_text("Проверить тИЦ",false); // получить ссылки с тиц больше лимита $res_urls=get_urls_tz($tz_limit,$separator); // переходим на проверку активных ссылок $browser->navigate("http://webmasters.ru/tools/tracker"); // задать сайт для проверки $input->set_value_by_name("url",$search_site); // задать url-s не больше 100 штук $textarea->set_value_by_name("urls",$res_urls); // проверить $button->click_by_inner_text("Поехали",false); // ждём пока отработает sleep(3); // получить только активные ссылки $res_urls = get_links_res($separator); // пауза перед записью в файл sleep(1); // записать результат в файл $textfile->write_file("res\\ya.".$search_site.".txt",$res_urls,60); // сообщим о завершении debug_mes("<b>выполнили!!</b>"); // Quit $app->quit();

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77

$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// /////////////////////////// настройки ///////////////////////////////////////////////

// сайт по которому ищем ссылки
$search_site="интересующий нас сайт";
// запрос для поиска ссылок для заданного сайта и временной диапозон
$search_string="\"http://$search_site\" date:20120301..20120716";

// разделитель для результатов
$separator="\n";
// ограничение по тиц
$tz_limit=0; // удалить ссылки с нулевым тиц

// глубина прохода в поисковые результаты
$cnt_pages = 15;
$crnt_page =1;

// режим отладки
$dbg=true;
// //////////////////////// дополнительные модули /////////////////////////////
// основные функции
require_once("functions.php");
// ////////////////////////// скрипт //////////////////////////////////////////////////////

// navigate to google
$browser->navigate("http://www.ya.ru");
// задать в поиск
$input->set_value_by_name("text",$search_string);
// искать
$button->click_by_number(0);

// разберём данные
$res_urls = ya_parse($separator);

// если нет ссылок останавливаем скрипт
if($res_urls=="")
{
    debug_mes("нет ссылок!!!");
    $app->quit();
}

// переходим на проверку тиц
$browser->navigate("http://www.raskruty.ru/tools/cy/");
// зададим urls
$textarea->set_inner_text_by_name("urrrls",$res_urls);
// проверим
$button->click_by_inner_text("Проверить тИЦ",false);
// получить ссылки с тиц больше лимита
$res_urls=get_urls_tz($tz_limit,$separator);

// переходим на проверку активных ссылок
$browser->navigate("http://webmasters.ru/tools/tracker");
// задать сайт для проверки
$input->set_value_by_name("url",$search_site);
// задать url-s  не больше 100 штук
$textarea->set_value_by_name("urls",$res_urls);
// проверить
$button->click_by_inner_text("Поехали",false);
// ждём пока отработает
sleep(3);
// получить только активные ссылки
$res_urls = get_links_res($separator);

// пауза перед записью в файл
sleep(1);
// записать результат в файл
$textfile->write_file("res\\ya.".$search_site.".txt",$res_urls,60);

// сообщим о завершении
debug_mes("<b>выполнили!!</b>");

// Quit
$app->quit();

Скрипт написан 16.07.2012 в Human Emulator 4.4.19 Advanced.
Скрипт исправлен 08.04.2013 в Human Emulator 4.6.5 Advanced.

скачать скрипт

Скрипт Human Emulator сборщик прокси с hidemyass.com

Этот скрипт собирает прокси с сайта hidemyass.com.

Скрипт достаточно простой. Перед сбором скрипт выставляет нужные галочки в настройках листа с прокси и нажимает обновить. В итоге мы имеем лист с прокси или socks, который и парсим в заданный в настройках скрипта файл. Единственный момент, который несколько усложнил скрипт это скрытые строки в поле ip. Эти строки пришлось вырезать и удалять лишнее.

Сам скрипт выглядит следующим образом:

PHP

<?php $xhe_host ="127.0.0.1:7010"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // ////////// scripts settings /////////////////// // path to proxy file $path_proxies="res/proxy.txt"; // get socks $b_get_socks=false; // current page $crnt_page=1; // coutn of pages $cnt_pages=-1; // debug mode $dbg=true; // //////////////////////// addition modules /////////////// require_once("tools/functions.php"); // ///////////////////// script ///////////////////////////////////////////////////////// // delete old proxy $file_os->delete($path_proxies); // navigate to proxy site $browser->navigate("http://hidemyass.com/proxy-list/"); // get socks or proxy $checkbox->check_by_number(2,!$b_get_socks); $checkbox->check_by_number(3,!$b_get_socks); $checkbox->check_by_number(4,$b_get_socks); // Anonymity level $checkbox->check_by_number(5,false); $checkbox->check_by_number(6,false); $checkbox->check_by_number(7,false); $checkbox->check_by_number(8,true); $checkbox->check_by_number(9,true); $checkbox->check_by_number(10,false); // Speed and Connection time $checkbox->check_by_number(11,false); $checkbox->check_by_number(12,false); $checkbox->check_by_number(13,true); $checkbox->check_by_number(14,false); $checkbox->check_by_number(15,false); $checkbox->check_by_number(16,true); // upgrades $button->click_by_name("updateresults"); // get all proxy to file get_proxy_list(); // Quit $app->quit(); ?>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

<?php

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// ////////// scripts settings ///////////////////

// path to proxy file
$path_proxies="res/proxy.txt";

// get socks
$b_get_socks=false;

// current page
$crnt_page=1;
// coutn of pages
$cnt_pages=-1;

// debug mode
$dbg=true;

// //////////////////////// addition modules ///////////////

require_once("tools/functions.php");

// ///////////////////// script /////////////////////////////////////////////////////////
// delete old proxy
$file_os->delete($path_proxies);

// navigate to proxy site
$browser->navigate("http://hidemyass.com/proxy-list/");

// get socks or proxy
$checkbox->check_by_number(2,!$b_get_socks);
$checkbox->check_by_number(3,!$b_get_socks);
$checkbox->check_by_number(4,$b_get_socks);

// Anonymity level
$checkbox->check_by_number(5,false);
$checkbox->check_by_number(6,false);
$checkbox->check_by_number(7,false);
$checkbox->check_by_number(8,true);
$checkbox->check_by_number(9,true);
$checkbox->check_by_number(10,false);

// Speed and Connection time
$checkbox->check_by_number(11,false);
$checkbox->check_by_number(12,false);
$checkbox->check_by_number(13,true);
$checkbox->check_by_number(14,false);
$checkbox->check_by_number(15,false);
$checkbox->check_by_number(16,true);

// upgrades
$button->click_by_name("updateresults");

// get all proxy to file
get_proxy_list();

// Quit
$app->quit();
?>

Скрипт написан 11.03.2012 Human Emulator 4.4.9 Advanced.
Скрипт обновлён 11.08.2012
Скрипт обновлён 10.04.2013

скачать скрипт

Cкрипт Human Emulator сбора ключевых слов из meta keywords сайтов из выдачи Яндекс

Это скрипт аналогичен скрипту Cкрипт Human Emulator сбора ключевых слов из meta kyewords единственное отличие между ними этот скрипт написан под выдачу Яндекс, а предыдущий разбирает выдачу Google.

Скрипт работает следующим образом: вбивается поисковый запрос в yandex. Далее скрипт идёт по поисковой выдаче и собирает meta keywords со всех страниц, которые попали в выдачу по этому запросу.Все слова записываются в файл с названием в виде запроса. В конце обработки запроса скрипт сортирует слова и убирает дубликаты из файла. Затем берёт следующий запрос и всё по новой. И так до тех пор пока не закончатся поисковые запросы. В результате мы имеем текстовые файлы с ключевыми словами.

Скрипт на вход принимает файл с поисковыми запросами в формате:

сбор meta keywords
сбор кеев meta
сбор мета keywords
и т.д.

В результате работы скрипта имеем текстовые файлы, например: сбор meta keywords.txt,сбор кеев meta.txt и т.д. в формате:
оптимизация
оптимизация страниц сайта
паетки
пластик
пластика
подбор запросов для продвижения
подвеска
поисковая
поисковая выдача
поисковые запросы
поисковые системы
и т.д.

Настройки скрипта:

PHP

// путь к файлу c запросами $path_to_data = "data/keywords.txt"; // папка с результатами $path_to_res = "res/"; // глубина прохода в поисковые результаты $cnt_pages = 10;

1
2
3
4
5
6
7

// путь к файлу c запросами
$path_to_data = "data/keywords.txt";
// папка с результатами
$path_to_res = "res/";

// глубина прохода в поисковые результаты
$cnt_pages = 10;

Сам скрипт выглядит следующим образом:

PHP

<?php /* производитель: x-scripts ** тип продукта: скрипт для программы Xweb Human Emulator ** сайт программы: humanemulator.info ** наш сайт: x-scripts.com ** по всем вопросам обращайтесь: ** email: order@x-scripts.com ** icq: 625657402 ** skype: igor_sev2 */ $xhe_host ="127.0.0.1:7011"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // //////////////////////// настройки скрипта ///////////////////////// // путь к файлу ключевых слов $path_to_data = "data/keywords.txt"; $path_to_res = "res/"; // глубина прохода в поисковые результаты $cnt_pages = 10; // текущая страница $crnt_page = 1; // массив ключевых слов $arr_of_kwds = array(); // скрипт работает в режим отладки $dbg = true; // //////////////////////// дополнительные модули /////////////// // функции require_once("tools/functions.php"); require_once("tools/a.charset.php"); // /////////////////////// скрипт /////////////////////////////////////////// debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили"); // получаем массив с ключевыми словами $arr_of_kwds = file($path_to_data); //print_r($arr_of_kwds); //$app->quit(); // пробежимся по всем ключевым словам foreach($arr_of_kwds as $key=>$kwd) { $kwd = trim($kwd); if ($kwd == "") { continue; } // go to yandex $browser->navigate("http://www.yandex.ua/"); sleep(2); // задаём слово в поиск $input->set_focus_by_name("text"); $input->set_value_by_name_by_form_name("text", $kwd, "form"); // нажмём пробел для отключения всплывшей подсказки $keyboard->send_key(32, true); // нажать enter $keyboard->send_key(13,true); sleep(3); // обнулим перед следующим проходом $crnt_page = 1; // работаем с ключевым словом на заданную длину while (true) { // получим все ссылки на сайты заключённые в префиксах $sites = $webpage->get_body_inter_prefix_all('<h2 class="b-serp-item__title">', '</h2>'); $sites = explode("<br>", $sites); // пройдёмся по всем полученным ссылкам for($i = 0; $i < count($sites); $i++) { $pr1 = 'href="'; $pr2 = '"'; $site = get_string($sites[$i], $pr1, $pr2); if ($site == "") continue; // разобрать ключи в файл parse_yandex($site,$kwd); sleep(2); } // организация перехода на следующую страницу if(!next_page($crnt_page)) { // убираем строки-дубликаты из файла после прохождения всех страниц $textfile->dedupe($path_to_res.$kwd.".txt", $path_to_res.$kwd.".txt", 60); sleep(3); break; } } } debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>"); // Quit $app->quit(); ?>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

<?php
/*  производитель: x-scripts
**  тип продукта: скрипт для программы Xweb Human Emulator
**  сайт программы: humanemulator.info
**  наш сайт: x-scripts.com
**  по всем вопросам обращайтесь:
**  email: order@x-scripts.com
**  icq: 625657402
**  skype: igor_sev2
*/
$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");
// //////////////////////// настройки скрипта /////////////////////////
// путь к файлу ключевых слов
$path_to_data = "data/keywords.txt";
$path_to_res = "res/";

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page = 1;
// массив ключевых слов
$arr_of_kwds = array();
// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции
require_once("tools/functions.php");
require_once("tools/a.charset.php");

// /////////////////////// скрипт ///////////////////////////////////////////
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");

// получаем массив с ключевыми словами
$arr_of_kwds = file($path_to_data);
//print_r($arr_of_kwds);
//$app->quit();
// пробежимся по всем ключевым словам
foreach($arr_of_kwds as $key=>$kwd)
{
$kwd = trim($kwd);
if ($kwd == "")
{
continue;
}
   // go to yandex
   $browser->navigate("http://www.yandex.ua/");
sleep(2);

// задаём слово в поиск
$input->set_focus_by_name("text");
$input->set_value_by_name_by_form_name("text", $kwd, "form");

   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32, true);
// нажать enter
   $keyboard->send_key(13,true);
sleep(3);

// обнулим перед следующим проходом
$crnt_page = 1;
// работаем с ключевым словом на заданную длину
while (true)
   {
// получим все ссылки на сайты заключённые в префиксах
$sites = $webpage->get_body_inter_prefix_all('<h2 class="b-serp-item__title">', '</h2>');
$sites = explode("<br>", $sites);

// пройдёмся по всем полученным ссылкам
for($i = 0; $i < count($sites); $i++)
{
$pr1 = 'href="';
$pr2 = '"';
$site = get_string($sites[$i], $pr1, $pr2);
if ($site == "")
  continue;

// разобрать ключи в файл
parse_yandex($site,$kwd);

sleep(2);
}

// организация перехода на следующую страницу
if(!next_page($crnt_page))
{
// убираем строки-дубликаты из файла после прохождения всех страниц
$textfile->dedupe($path_to_res.$kwd.".txt", $path_to_res.$kwd.".txt", 60);
sleep(3);
break;
}
}
}
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>");
// Quit
$app->quit();
?>

Скрипт написан 17.03.2013 в Human Emulator 4.6.5 Advanced.

скачать скрипт

Cкрипт Human Emulator сбора ключевых слов из meta keywords сайтов

Не смотря на споры, которые ведутся вокруг того нужно или не нужно прописывать meta keywords на страницах своего сайта, очень много вебмастеров заполняют эти тэги нормальными ключевыми словами, по которым они хотели бы попасть в топ поисковой выдачи. Мы предлагаем вашему вниманию скрипт, который собирает эти ключевые слова.

Скрипт работает следующим образом: вбивается поисковый запрос в google. Далее скрипт идёт по поисковой выдаче и собирает meta keywords со всех страниц, которые попали в выдачу по этому запросу.Все слова записываются в файл с названием в виде запроса. В конце обработки запроса скрипт отсортировывает слова и убирает дубликаты из файла. Затем берёт следующий запрос и всё по новой. И так до тех пор пока не закончатся поисковые запросы. В результате мы имеем текстовые файлы с ключевыми словами.

Скрипт на вход принимает файл с поисковыми запросами в формате:

сбор meta keywords
сбор кеев meta
сбор мета keywords
и т.д.

В результате работы скрипта имеем текстовые файлы, например: сбор meta keywords.txt,сбор кеев meta.txt и т.д. в формате:

оптимизация
оптимизация страниц сайта
паетки
пластик
пластика
подбор запросов для продвижения
подвеска
поисковая
поисковая выдача
поисковые запросы
поисковые системы
и т.д.

Настройки скрипта:

PHP

// путь к файлу c запросами $path_to_data = "data/keywords.txt"; // папка с результатами $path_to_res = "res/"; // глубина прохода в поисковые результаты $cnt_pages = 10;

1
2
3
4
5
6
7

// путь к файлу c запросами
$path_to_data = "data/keywords.txt";
// папка с результатами
$path_to_res = "res/";

// глубина прохода в поисковые результаты
$cnt_pages = 10;

Сам скрипт выглядит следующим образом:

PHP

<?php /* производитель: x-scripts ** тип продукта: скрипт под Xweb Human Emulator ** сайт программы: humanemulator.info ** наш сайт: x-scripts.com ** по всем вопросам обращайтесь: ** email: order@x-scripts.com ** icq: 625657402 ** skype: igor_sev2 */ $xhe_host ="127.0.0.1:7010"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // //////////////////////// настройки скрипта ///////////////////////// // путь к файлу ключевых слов $path_to_data = "data/keywords.txt"; // папка с результатами $path_to_res = "res/"; // глубина прохода в поисковые результаты $cnt_pages = 10; // текущая страница $crnt_page = 1; // массив ключевых слов $arr_of_kwds = array(); // скрипт работает в режим отладки $dbg = true; // //////////////////////// дополнительные модули /////////////// // функции require_once("tools/functions.php"); require_once("tools/a.charset.php"); // /////////////////////// скрипт /////////////////////////////////////////// debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили"); // получаем массив с ключевыми словами $arr_of_kwds = file($path_to_data); // пробежимся по всем ключевым словам foreach($arr_of_kwds as $key=>$kwd) { $kwd = trim($kwd); if ($kwd == "") { continue; } // перейти на гугль $browser->navigate("google.com"); sleep(2); // задаём слово в поиск $input->set_value_by_name("q", $kwd); $input->click_by_name("q"); // нажмём пробел для отключения всплывшей подсказки $keyboard->send_key(32, true); // нажать enter $keyboard->send_key(13,true); sleep(3); // обнулим перед следующим проходом $crnt_page = 1; // работаем с ключевым словом на заданную длину while (true) { // получим все ссылки на сайты заключённые в префиксах $sites = $webpage->get_body_inter_prefix_all('<h3 class="r">', '</h3>'); $sites = explode("<br>", $sites); // пройдёмся по всем полученным ссылкам for($i = 0; $i < count($sites); $i++) { // получить ссылку на сайт $pr1 = 'href="'; $pr2 = '">'; $site = get_string($sites[$i], $pr1, $pr2); if ($site == "") continue; // вывод в панель отладки debug_mess("ссылка на сайт : ".$site); // записать найденные ключи в файл get_meta_kw($site,$kwd); sleep(2); } // организация перехода на следующую страницу if(!next_page($crnt_page)) { // убираем строки-дубликаты из файла $textfile->dedupe($path_to_res.$kwd.".txt", $path_to_res.$kwd.".txt", 60); sleep(3); break; } } } debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>"); // Quit $app->quit(); ?>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107

<?php
/*  производитель: x-scripts
**  тип продукта: скрипт под Xweb Human Emulator
**  сайт программы: humanemulator.info
**  наш сайт: x-scripts.com
**  по всем вопросам обращайтесь:
**  email: order@x-scripts.com
**  icq: 625657402
**  skype: igor_sev2
*/

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// путь к файлу ключевых слов
$path_to_data = "data/keywords.txt";
// папка с результатами
$path_to_res = "res/";

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page = 1;
// массив ключевых слов
$arr_of_kwds = array();
// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции
require_once("tools/functions.php");
require_once("tools/a.charset.php");

// /////////////////////// скрипт ///////////////////////////////////////////
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");

// получаем массив с ключевыми словами
$arr_of_kwds = file($path_to_data);

// пробежимся по всем ключевым словам
foreach($arr_of_kwds as $key=>$kwd)
{
$kwd = trim($kwd);
if ($kwd == "")
{
continue;
}
   // перейти на гугль
   $browser->navigate("google.com");
sleep(2);

// задаём слово в поиск
   $input->set_value_by_name("q", $kwd);
   $input->click_by_name("q");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32, true);
// нажать enter
   $keyboard->send_key(13,true);
sleep(3);

   // обнулим перед следующим проходом
$crnt_page = 1;

// работаем с ключевым словом на заданную длину
while (true)
   {
// получим все ссылки на сайты заключённые в префиксах
$sites = $webpage->get_body_inter_prefix_all('<h3 class="r">', '</h3>');
$sites = explode("<br>", $sites);

// пройдёмся по всем полученным ссылкам
for($i = 0; $i < count($sites); $i++)
{
// получить ссылку на сайт
$pr1 = 'href="';
$pr2 = '">';
$site = get_string($sites[$i], $pr1, $pr2);
if ($site == "")
continue;

// вывод в панель отладки
debug_mess("ссылка на сайт : ".$site);

         // записать найденные ключи в файл
         get_meta_kw($site,$kwd);

sleep(2);
}

// организация перехода на следующую страницу
if(!next_page($crnt_page))
{
// убираем строки-дубликаты из файла
$textfile->dedupe($path_to_res.$kwd.".txt", $path_to_res.$kwd.".txt", 60);
sleep(3);
break;
}
}

}
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>");
// Quit
$app->quit();
?>

Скрипт написан 1.03.2013 в Human Emulator 4.6.5 Advanced.

скачать скрипт

Скрипт Human Emulator сборщик WordPress сайтов

Если вы столкнулись с задачей сбора базы сайтов на движке WordPress, то вам пригодится наше решение. Скрипт, собирающий WordPress сайты в кратчайшие сроки соберет вам актуальную базу автоматически и без вашего участия. Вы получите лишь готовый результат без трудозатрат.

Скрипт работает следующим образом: берёт ключи из файла с поисковыми фразами и вводит их в поле поиска google. Затем разбирает поисковые результаты Google на ссылки. Переходит по ссылкам и проверяет действительно это WordPress или нет. Если сайт прошёл проверку добавляет его в наш список WordPress сайтов. В конце скрипт удаляет дубликаты из списка. И у вас на руках уникальная база WordPress сайтов. С помощью добавления в скрипт дополнительных проверок вы сможете отфильтровать список для ваших целей.

На входе скрипт принимает файл с поисковыми фразами в формате:

/wp-admin/
/wp-admin/ seo
/wp-admin/ ceo
/wp-admin/ sites
wordpress сайты

На выходе получаем файл со списком WP сайтов в формате:

wordpress.org
fr.wordpress.org
t-prod.net
wordpress.buldozer.fr
wp-admin.org.ua
wordpresso.org
nerdfrat.com
fr.forums.wordpress.com
… и т.д.

Настройки скрипта:

PHP

// файл с данными для скрипта $keys = file("data/keys.txt"); // файл с результатами $res_path="res/wp_sites.txt"; // глубина прохода в поисковые результаты // со скольких страниц собирать ссылки прежде чем перейти к следующему запросу // если нужно собирать все ссылки надо просто задать этот параметр = -1 $cnt_pages = 30;

1
2
3
4
5
6
7
8

// файл с данными для скрипта
$keys = file("data/keys.txt");
// файл с результатами
$res_path="res/wp_sites.txt";
// глубина прохода в поисковые результаты
// со скольких страниц собирать ссылки прежде чем перейти к следующему запросу
// если нужно собирать все ссылки надо просто задать этот параметр =  -1
$cnt_pages = 30;

Сам скрипт выглядит следующим образом:

PHP

<?php /* ** // Наш сайт http://x-scripts.com // Скрипт поиска сайтов на wordpress . // страничка скрипта http://x-scripts.com/scripts/search_wp.php // по любым вопросам касающимся скрипта // можно написать нам на мыло order@x-scripts.com ** */ $xhe_host ="127.0.0.1:7010"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // //////////////////////// настройки скрипта ///////////////////////// // файл с данными для скрипта $keys = file("data/keys.txt"); // файл с результатами $res_path="res/wp_sites.txt"; // глубина прохода в поисковые результаты $cnt_pages = 30; // текущая страница $crnt_page =1; // скрипт работает в режим отладки $dbg = true; // //////////////////////// дополнительные модули /////////////// // функции require_once("tools/functions.php"); // /////////////////////// скрипт /////////////////////////////////////////// debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили"); // задать авторизацию по умолчанию // что бы не показывало окно авторизации $browser->set_default_authorization("",""); // создать второй браузер $browser->set_count(2); // удалим дубликаты в результирующем файле dedupe($res_path); // кол-во for($ii=0;$ii<count($keys);$ii++) { // получить запрос $key = trim($keys[$ii]); // перейти на гугл $browser->navigate("google.com"); // задаём слово в поиск $input->set_value_by_name("q",$key); $input->click_by_name("q"); // нажмём пробел для отключения всплывшей подсказки $keyboard->send_key(32,true); // нажать enter $keyboard->send_key(13,true); // ждём sleep(1); // обнулим перед следующим проходом $crnt_page=1; while(true) { // получим все ссылки на сайты заключённые в тэгах <cite> $sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>"); $sites=explode("<br>",$sites); $browser->set_active_browser(1); // пройдёмся по всем полученным ссылкам for($i=0;$i<count($sites);$i++) { // переходим на сайт $site=str_replace("<b>","",trim($sites[$i])); $site=str_replace("</b>","",$site); if($site=="") continue; // вывод в панель отладки debug_mess("ссылка на сайт : ".$site); // проверить найденный сайт это wp или нет check_wp($site); } // сделать активным главный $browser->set_active_browser(0); // не перешли на следующую страницу if(!next_page($crnt_page)) break; } // удалим дубликаты в файле с результатами dedupe($res_path); } debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу"); // Quit $app->quit(); ?>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98

<?php
/* **
//  Наш сайт http://x-scripts.com
//  Скрипт поиска сайтов на wordpress .
// страничка скрипта http://x-scripts.com/scripts/search_wp.php
//  по любым вопросам касающимся скрипта
//  можно написать нам на мыло order@x-scripts.com
** */
$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");
// файл с результатами
$res_path="res/wp_sites.txt";
// глубина прохода в поисковые результаты
$cnt_pages = 30;
// текущая страница
$crnt_page =1;

// скрипт работает в режим отладки
$dbg = true;
// //////////////////////// дополнительные модули ///////////////
// функции
require_once("tools/functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");
// задать авторизацию по умолчанию
// что бы не показывало окно авторизации
$browser->set_default_authorization("","");

// создать второй браузер
$browser->set_count(2);
// удалим дубликаты в результирующем файле
dedupe($res_path);
// кол-во
for($ii=0;$ii<count($keys);$ii++)
{
// получить запрос
$key = trim($keys[$ii]);

   // перейти на гугл
   $browser->navigate("google.com");

   // задаём слово в поиск
   $input->set_value_by_name("q",$key);
   $input->click_by_name("q");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32,true);

   // нажать enter
   $keyboard->send_key(13,true);

// ждём
sleep(1);

   // обнулим перед следующим проходом
$crnt_page=1;

   while(true)
   {
// получим все ссылки на сайты заключённые в тэгах <cite>
$sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>");
$sites=explode("<br>",$sites);

       $browser->set_active_browser(1);
    // пройдёмся по всем полученным ссылкам
for($i=0;$i<count($sites);$i++)
{
// переходим на сайт
$site=str_replace("<b>","",trim($sites[$i]));
$site=str_replace("</b>","",$site);
if($site=="")
  continue;
// вывод в панель отладки
debug_mess("ссылка на сайт : ".$site);
         // проверить найденный сайт это wp или нет
         check_wp($site);
}
      // сделать активным главный
      $browser->set_active_browser(0);
// не перешли на следующую страницу
if(!next_page($crnt_page))
  break;
  }

// удалим дубликаты в  файле с результатами
dedupe($res_path);
}
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу");

// Quit
$app->quit();
?>

Скрипт написан 18.01.2013 в Human Emulator 4.6.2 Advanced.
На момент публикации статьи 21.01.2013 скрипт был рабочий.

скачать скрипт

Скрипт Human Emulator парсер поисковой выдачи mail.ru

Ещё один парсер выдачи поисковых результатов пополнил нашу коллекцию парсеров. На этот раз это парсер Маил.ру.
Это скрипт, который как и предыдущие парсеры демонстрирует как можно разобрать поисковую выдачу теперь на примере mail.ru.

Скрипт работает следующим образом: берём ключи из файла с поисковыми фразами и вводим их в поле поиска mail.ru.
Затем разбираем поисковую выдачу маил.ру на ссылки.

Этот скрипт так же является заготовкой под любой ваш скрипт, который будет работать с выдачей Mail.ru.
Диапозон его применения аналогичен трём предыдущим парсерам поисковой выдачи: парсеру Яндекса и парсеру Гугла и парсеру Рамблер

На входе скрипт принимает файл с поисковыми фразами в формате:
human emulator
парсер human emulator
парсер mail.ru xhe
xhe парсер
mail.ru parser

Настройки скрипта:

// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты 
// со скольких страниц собирать товары прежде чем перейти к следующему
// если нужно собирать все товары надо просто задать этот параметр =  -1
$cnt_pages = 10;

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

// со скольких страниц собирать товары прежде чем перейти к следующему

// если нужно собирать все товары надо просто задать этот параметр = -1

$cnt_pages = 10;

Сам скрипт выглядит следующим образом:

<?php

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page =1; 

// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции 
require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////
// кол-во
for($ii=0;$ii<count($keys);$ii++)
{
	// получить запрос
	$key = trim($keys[$ii]);
   
   // перейти на гугль	
   $browser->navigate("mail.ru");

  // задаём слово в поиск
   $input->set_value_by_name("q",$key);
   $input->click_by_name("q");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32,true);

   // нажать enter
   $keyboard->send_key(13,true);

	// ждём
	sleep(1);
   // обнулим перед следующим проходом
	$crnt_page=1;

   while(true)
   {
		 // получим все ссылки на сайты заключённые в тэгах <cite>
		 $sites=$webpage->get_body_inter_prefix_all("<cite ","</cite>");
		 $sites=explode("<br>",$sites);
	    // пройдёмся по всем полученным ссылкам
		 for($i=0;$i<count($sites);$i++)
		 {        
			// переходим на сайт
			$site=get_string(trim($sites[$i]),"href=\"","\" ");
			if($site=="")
			  continue;
			// вывод в панель отладки
			debug_mess("ссылка на сайт : ".$site);
	
			/* ***
				тут что то делаем с полученными из гугль сайтами 
			* */
		 }

		 // не перешли на следующую страницу 
		if(!next_page($crnt_page)) 
		  break;
  }
}
// Quit
$app->quit();
?>

<?php

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator

require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

$cnt_pages = 10;

// текущая страница

$crnt_page =1;

// скрипт работает в режим отладки

$dbg = true;

// //////////////////////// дополнительные модули ///////////////

// функции

require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

// кол-во

for($ii=0;$ii<count($keys);$ii++)

{

// получить запрос

$key = trim($keys[$ii]);

// перейти на гугль

$browser->navigate("mail.ru");

// задаём слово в поиск

$input->set_value_by_name("q",$key);

$input->click_by_name("q");

// нажмём пробел для отключения всплывшей подсказки

$keyboard->send_key(32,true);

// нажать enter

$keyboard->send_key(13,true);

// ждём

sleep(1);

// обнулим перед следующим проходом

$crnt_page=1;

while(true)

{

// получим все ссылки на сайты заключённые в тэгах <cite>

$sites=$webpage->get_body_inter_prefix_all("<cite ","</cite>");

$sites=explode("<br>",$sites);

// пройдёмся по всем полученным ссылкам

for($i=0;$i<count($sites);$i++)

{

// переходим на сайт

$site=get_string(trim($sites[$i]),"href=\"","\" ");

if($site=="")

continue;

// вывод в панель отладки

debug_mess("ссылка на сайт : ".$site);

/* ***

тут что то делаем с полученными из гугль сайтами

* */

}

// не перешли на следующую страницу

if(!next_page($crnt_page))

break;

}

// Quit

$app->quit();

Скрипт написан 8.10.2012 в Human Emulator 4.4.19 Advanced.
На момент публикации статьи 14.10.2012 скрипт был рабочий.

скачать скрипт

Cкрипт Human Emulator парсер поисковой выдачи Рамблера

Мы решили дополнить свою коллекцию парсеров выдачи поисковых машин ещё одним и представляем вашему вниманию парсер Рамблера.
Это скрипт, работает аналогично двух предыдущим парсерам:Яндекса и Гугл.

Скрипт берёт ключи из файла с поисковыми фразами и вводим их в поле поиска на сайте rambler.ru. Затем разбирает поисковую выдачу Rambler на ссылки. Эти ссылки выводит в окно отладки для наглядности работы скрипта.

Как и предыдущие скрипты этот скрипт является заготовкой под любой ваш скрипт, который будет работать с выдачей Rambler.

На входе скрипт принимает файл с поисковыми фразами в формате:

human emulator
парсер human emulator
парсер рамблер xhe
xhe парсер
rambler parser

Настройки скрипта:

// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты 
// со скольких страниц собирать товары прежде чем перейти к следующему
// если нужно собирать все товары надо просто задать этот параметр =  -1
$cnt_pages = 10;

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

// со скольких страниц собирать товары прежде чем перейти к следующему

// если нужно собирать все товары надо просто задать этот параметр = -1

$cnt_pages = 10;

Сам скрипт выглядит следующим образом:

<?php

$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page =1; 

// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции 
require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////
// кол-во
for($ii=0;$ii<count($keys);$ii++)
{
	// получить запрос
	$key = trim($keys[$ii]);
   
   // перейти на рамблер	
   $browser->navigate("rambler.ru");

   // задаём слово в поиск
   $input->set_value_by_name("query",$key);
   $input->click_by_name("query");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32,true);

   // нажать enter
   $keyboard->send_key(13,true);

	// ждём
	sleep(1);
   // обнулим перед следующим проходом
	$crnt_page=1;

   while(true)
   {
		 // получим все ссылки на сайты заключённые в тэгах <cite>
		 $sites=$webpage->get_body_inter_prefix_all("b-serp__list_item_title","</h2>");
                 // получим массив ссылок из строки 
		 $sites=explode("<br>",$sites);
	         // пройдёмся по всем полученным ссылкам
		 for($i=0;$i<count($sites);$i++)
		 {        
			// переходим на сайт
			$site=get_string(trim($sites[$i]),"href=\"","\" ");
			
			if($site=="")
			  continue;
			// вывод в панель отладки
			debug_mess("ссылка на сайт : ".$site);
	
			/* ***
				тут что то делаем с полученными из гугль сайтами 
			* */
		 }
      
		 // не перешли на следующую страницу 
		if(!next_page($crnt_page)) 
		  break;
  }
}
// Quit
$app->quit();
?>

<?php

$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator

require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

$cnt_pages = 10;

// текущая страница

$crnt_page =1;

// скрипт работает в режим отладки

$dbg = true;

// //////////////////////// дополнительные модули ///////////////

// функции

require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

// кол-во

for($ii=0;$ii<count($keys);$ii++)

{

// получить запрос

$key = trim($keys[$ii]);

// перейти на рамблер

$browser->navigate("rambler.ru");

// задаём слово в поиск

$input->set_value_by_name("query",$key);

$input->click_by_name("query");

// нажмём пробел для отключения всплывшей подсказки

$keyboard->send_key(32,true);

// нажать enter

$keyboard->send_key(13,true);

// ждём

sleep(1);

// обнулим перед следующим проходом

$crnt_page=1;

while(true)

{

// получим все ссылки на сайты заключённые в тэгах <cite>

$sites=$webpage->get_body_inter_prefix_all("b-serp__list_item_title","</h2>");

// получим массив ссылок из строки

$sites=explode("<br>",$sites);

// пройдёмся по всем полученным ссылкам

for($i=0;$i<count($sites);$i++)

{

// переходим на сайт

$site=get_string(trim($sites[$i]),"href=\"","\" ");

if($site=="")

continue;

// вывод в панель отладки

debug_mess("ссылка на сайт : ".$site);

/* ***

тут что то делаем с полученными из гугль сайтами

* */

}

// не перешли на следующую страницу

if(!next_page($crnt_page))

break;

}

// Quit

$app->quit();

Скрипт написан 4.10.2012 в Human Emulator 4.4.19 Advanced.
На момент публикации статьи 5.10.2012 скрипт был рабочий.

скачать скрипт

Скрипт Human Emulator сборщик email адресов

Другие наши проекты на эту тему!

Сборщик Email Адресов

Программа Сборщик email адресов. Это наш первый программный продукт написанный с использованием C# Human Emulator API.

Описание и инсталяшка программы Сборщик Email Адресов

C# исходники программы Сборщик Email Адресов

Скрипт сбора базы email адресов. Этот скрипт, поможет собрать вам ваши собственные базы почтовых адресов.

Скрипт работает следующим образом: берём поисковые фразы из файла и вводим их в поле поиска google. Затем разбираем поисковые результаты Google на ссылки. Далее идём по полученным ссылкам, заходим на каждый сайт, переходим на страницу «Контакты» или «О нас» и, используя регулярное выражение php, собираем все почтовые адреса на странице. Затем пишем то что собрали в файл с удалением дубликатов. Вот и готова наша база с целевыми email адресами.

На входе скрипт принимает файл с поисковыми фразами в формате:

мебель украина контакты
мебель киев контакты
мебель донецк контакты
мебель харьков контакты

На выходе имеем файл с результатами в формате:

decor2004@inbox.ru
info@liganova.kiev.ua
evgenzap@ukr.net
vlabi@optima.com.ua
tasi@io.zp.ua

Настройки скрипта:

// файл с данными для скрипта
$keys = file("data/keys.txt");
// файл с результатами
$file_res="res/email.txt";

// глубина прохода в поисковые результаты
$cnt_pages = 10;

// файл с данными для скрипта

$keys = file("data/keys.txt");

// файл с результатами

$file_res="res/email.txt";

// глубина прохода в поисковые результаты

$cnt_pages = 10;

Для работы скрипта лучше отключить всё лишнее за исключением java script.
Для написания этого скрипта использовался скрипт заготовка Парсер Гугль. Используя аналогичный скрипт-заготовку Парсер Яндекса можно легко написать такой же скрипт сбора почты для Яндекса.

Сам скрипт выглядит следующим образом:

<?php

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");
// файл с результатами
$file_res="res/email.txt";

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page =1; 

// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции 
require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");

// кол-во
for($ii=0;$ii<count($keys);$ii++)
{
	// получить запрос
	$key = trim($keys[$ii]);

   // перейти на гугль	
   $browser->navigate("google.com");

   // задаём слово в поиск
   $input->set_value_by_name("q",$key);
   $input->click_by_name("q");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32,true);

   // нажать enter
   $keyboard->send_key(13,true);
   
	// ждём
	sleep(3);
 
   // обнулим перед следующим проходом
	$crnt_page=1;
	
   while(true)
   {
		 // получим все ссылки на сайты заключённые в тэгах <cite>
		 $sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>");
		 $sites=explode("<br>",$sites);
	    // пройдёмся по всем полученным ссылкам
		 for($i=0;$i<count($sites);$i++)
		 {        
			// переходим на сайт
			$site=str_replace("<b>","",trim($sites[$i]));
			$site=str_replace("</b>","",$site);
			if($site=="")
			  continue;
			// вывод в панель отладки
			//debug_mess("ссылка на сайт : ".$site); 
	      
			// открыть и сделать активным новый браузер
			$browser->set_count(2);
			$browser->set_active_browser(1,true);
         
         // переходим на сайт
         $browser->navigate($site);
         sleep(1);
         // перейти на контакты
         $anchor->click_by_inner_text("контакты");
         $anchor->click_by_inner_text("Контакты");
         $anchor->click_by_inner_text("О нас");
         $anchor->click_by_inner_text("о нас");
			sleep(2);
         // ищем все email на странице
			preg_match_all('#[\w\d.-_]+@([\w\d.-_]+\.)+[a-zA-Z]{2,6}#i', $webpage->get_source(), $matches);
       
			// пройдёмся по полученным результатам
			foreach ($matches[0] as $key=>$value)
         {
				//debug_mess("мыло: ".$value);
            // уберём лишнее
            $str_mail=str_replace(">","",$value);
            $str_mail=str_replace("<","",$str_mail);  
            $str_mail=str_replace("mailto:","",$str_mail);   
            $str_mail=str_replace("/","",$str_mail); 
            $str_mail=str_replace("mail:","",$str_mail);  
       
            // запишем в файл
            $textfile->add_string_to_file($file_res,trim($str_mail)."\n",60) ;
         }
		
         // закрываем и переходим обратно
			$browser->set_active_browser(0,true);
			$browser->close_all_tabs();
	      
         // убрать дубликаты из файла
         dedupe($file_res);
		 }

		 // не перешли на следующую страницу 
		if(!next_page($crnt_page)) 
		  break;
  }

}
debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>");

// Quit
$app->quit();
?>

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

<?php

$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator

require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////

// файл с данными для скрипта

$keys = file("data/keys.txt");

// файл с результатами

$file_res="res/email.txt";

// глубина прохода в поисковые результаты

$cnt_pages = 10;

// текущая страница

$crnt_page =1;

// скрипт работает в режим отладки

$dbg = true;

// //////////////////////// дополнительные модули ///////////////

// функции

require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");

// кол-во

for($ii=0;$ii<count($keys);$ii++)

{

// получить запрос

$key = trim($keys[$ii]);

// перейти на гугль

$browser->navigate("google.com");

// задаём слово в поиск

$input->set_value_by_name("q",$key);

$input->click_by_name("q");

// нажмём пробел для отключения всплывшей подсказки

$keyboard->send_key(32,true);

// нажать enter

$keyboard->send_key(13,true);

// ждём

sleep(3);

// обнулим перед следующим проходом

$crnt_page=1;

while(true)

{

// получим все ссылки на сайты заключённые в тэгах <cite>

$sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>");

$sites=explode("<br>",$sites);

// пройдёмся по всем полученным ссылкам

for($i=0;$i<count($sites);$i++)

{

// переходим на сайт

$site=str_replace("<b>","",trim($sites[$i]));

$site=str_replace("</b>","",$site);

if($site=="")

continue;

// вывод в панель отладки

//debug_mess("ссылка на сайт : ".$site);

// открыть и сделать активным новый браузер

$browser->set_count(2);

$browser->set_active_browser(1,true);

// переходим на сайт

$browser->navigate($site);

sleep(1);

// перейти на контакты

$anchor->click_by_inner_text("контакты");

$anchor->click_by_inner_text("Контакты");

$anchor->click_by_inner_text("О нас");

$anchor->click_by_inner_text("о нас");

sleep(2);

// ищем все email на странице

preg_match_all('#[\w\d.-_]+@([\w\d.-_]+\.)+[a-zA-Z]{2,6}#i', $webpage->get_source(), $matches);

// пройдёмся по полученным результатам

foreach ($matches[0] as $key=>$value)

{

//debug_mess("мыло: ".$value);

// уберём лишнее

$str_mail=str_replace(">","",$value);

$str_mail=str_replace("<","",$str_mail);

$str_mail=str_replace("mailto:","",$str_mail);

$str_mail=str_replace("/","",$str_mail);

$str_mail=str_replace("mail:","",$str_mail);

// запишем в файл

$textfile->add_string_to_file($file_res,trim($str_mail)."\n",60) ;

}

// закрываем и переходим обратно

$browser->set_active_browser(0,true);

$browser->close_all_tabs();

// убрать дубликаты из файла

dedupe($file_res);

}

// не перешли на следующую страницу

if(!next_page($crnt_page))

break;

}

debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>");

// Quit

$app->quit();

Скрипт написан 2.10.2012 в Human Emulator 4.4.19 Advanced.
На момент публикации статьи 3.10.2012 скрипт был рабочий.

Обсуждение этого скрипта на форуме. В процессе обсуждения скрипт приводится в рабочее состояние.

скачать скрипт

Скрипт Human Emulator парсер поисковой выдачи Google

Скрипт парсер Гугл. Это скрипт, который демонстрирует как можно разобрать поисковую выдачу Гугл.

Скрипт работает следующим образом: берём ключи из файла с поисковыми фразами и вводим их в поле поиска google.
Затем разбираем поисковые результаты Google на ссылки.

Этот скрипт является заготовкой под любой ваш скрипт, который будет работать с выдачей Гугл. Этот скрипт может быть использован
например, для определения позиции вашего сайта в поисковых результатах Google по заданному ключевому запросу или для того что бы получить списки сайтов,
которые по этому запросу находятся в топ-10, топ-20, топ-30 и т.д. Можно собирать базы сайтов заданного движка — dle сайты,каталоги, word press сайты и т.д.

На входе скрипт принимает файл с поисковыми фразами в формате:
human emulator
парсер human emulator
парсер гугль xhe
xhe парсер
google parser

Настройки скрипта:

// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты 
// со скольких страниц собирать товары прежде чем перейти к следующему
// если нужно собирать все товары надо просто задать этот параметр =  -1
$cnt_pages = 10;

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

// со скольких страниц собирать товары прежде чем перейти к следующему

// если нужно собирать все товары надо просто задать этот параметр = -1

$cnt_pages = 10;

Сам скрипт выглядит следующим образом:

<?php

$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page =1; 

// скрипт работает в режим отладки
$dbg = true;
// //////////////////////// дополнительные модули ///////////////
// функции 
require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////
// кол-во
for($ii=0;$ii<count($keys);$ii++)
{
	// получить запрос
	$key = trim($keys[$ii]);

   // перейти на гугл	
   $browser->navigate("google.com");

   // задаём слово в поиск
   $input->set_value_by_name("q",$key);
   $input->click_by_name("q");
   // нажмём пробел для отключения всплывшей подсказки
   $keyboard->send_key(32,true);

   // нажать enter
   $keyboard->send_key(13,true);

	// ждём
	sleep(1);
   // обнулим перед следующим проходом
   $crnt_page=1;
	
   while(true)
   {
		 // получим все ссылки на сайты заключённые в тэгах <cite>
		 $sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>");
		 $sites=explode("<br>",$sites);
	    // пройдёмся по всем полученным ссылкам
		 for($i=0;$i<count($sites);$i++)
		 {        
			// переходим на сайт
			$site=str_replace("<b>","",trim($sites[$i]));
			$site=str_replace("</b>","",$site);
			if($site=="")
			  continue;
			// вывод в панель отладки
			debug_mess("ссылка на сайт : ".$site);
	
			/* ***
				тут что то делаем с полученными из гугл сайтами 
			* */
		 }

		 // не перешли на следующую страницу 
		if(!next_page($crnt_page)) 
		  break;
  }

}

// Quit
$app->quit();
?>

<?php

$xhe_host ="127.0.0.1:7011";

// The following code is required to properly run XWeb Human Emulator

require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////

// файл с данными для скрипта

$keys = file("data/keys.txt");

// глубина прохода в поисковые результаты

$cnt_pages = 10;

// текущая страница

$crnt_page =1;

// скрипт работает в режим отладки

$dbg = true;

// //////////////////////// дополнительные модули ///////////////

// функции

require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

// кол-во

for($ii=0;$ii<count($keys);$ii++)

{

// получить запрос

$key = trim($keys[$ii]);

// перейти на гугл

$browser->navigate("google.com");

// задаём слово в поиск

$input->set_value_by_name("q",$key);

$input->click_by_name("q");

// нажмём пробел для отключения всплывшей подсказки

$keyboard->send_key(32,true);

// нажать enter

$keyboard->send_key(13,true);

// ждём

sleep(1);

// обнулим перед следующим проходом

$crnt_page=1;

while(true)

{

// получим все ссылки на сайты заключённые в тэгах <cite>

$sites=$webpage->get_body_inter_prefix_all("<cite>","</cite>");

$sites=explode("<br>",$sites);

// пройдёмся по всем полученным ссылкам

for($i=0;$i<count($sites);$i++)

{

// переходим на сайт

$site=str_replace("<b>","",trim($sites[$i]));

$site=str_replace("</b>","",$site);

if($site=="")

continue;

// вывод в панель отладки

debug_mess("ссылка на сайт : ".$site);

/* ***

тут что то делаем с полученными из гугл сайтами

* */

}

// не перешли на следующую страницу

if(!next_page($crnt_page))

break;

}

// Quit

$app->quit();

Скрипт написан 1.10.2012 в Human Emulator 4.4.19 Advanced.
На момент публикации статьи 1.10.2012 скрипт был рабочий.

скачать скрипт

Archives