Предлагаем вашему вниманию скрипт сборщик трастовых сайтов. Этот скрипт в очень короткие сроки соберёт для вас базу трастовых сайтов, на которых можно оставить активную ссылку. Для того что бы собрать эту базу нам понадобится любой чужой прогнанный сайт. Найти такие сайты в сети не представляет труда. Главное подобрать свеже прогнанный сайт.
Так же с помощью этого скрипта можно посмотреть активность любого интересующего вас сайта в яндекс за любой промежуток времени.
Собственно в чём фишка. Мы берём подобранный нами сайт и вводим в яндекс такой вот запрос — «http://site.ru» date:20110901..20111020. В выдачу яндекс выдаст все последние проиндексированные ссылки, которые появились в интрнете за заданный промежуток времени. Мы получаем все страницы, на которых стоят эти ссылки. Далее скрипт парсит выдачу яндекса. Теперь у нас есть ссылки из выдачи, далее проверяем их Тиц и удаляем ненужные, а затем проверяем оставшиеся ссылки на наличие обратной кликабельной ссылки. Опять таки удаляем лишнее. Вот и всё база готова.
Настройки скрипта:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
// сайт по которому ищем ссылки $search_site="интересующий нас сайт"; // запрос для поиска ссылок для заданного сайта и временной диапозон $search_string="\"http://$search_site\" date:20120301..20120716"; // разделитель для результатов $separator="\n"; // ограничение по тиц - здесь задаём интересующий нас ТИЦ $tz_limit=0; // удалить ссылки с нулевым тиц // глубина прохода в поисковые результаты $cnt_pages = 15; $crnt_page =1; - страница выдачи яндекс с которой начинать разбор ссылок |
Собственно сам скрипт:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 |
$xhe_host ="127.0.0.1:7011"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // /////////////////////////// настройки /////////////////////////////////////////////// // сайт по которому ищем ссылки $search_site="интересующий нас сайт"; // запрос для поиска ссылок для заданного сайта и временной диапозон $search_string="\"http://$search_site\" date:20120301..20120716"; // разделитель для результатов $separator="\n"; // ограничение по тиц $tz_limit=0; // удалить ссылки с нулевым тиц // глубина прохода в поисковые результаты $cnt_pages = 15; $crnt_page =1; // режим отладки $dbg=true; // //////////////////////// дополнительные модули ///////////////////////////// // основные функции require_once("functions.php"); // ////////////////////////// скрипт ////////////////////////////////////////////////////// // navigate to google $browser->navigate("http://www.ya.ru"); // задать в поиск $input->set_value_by_name("text",$search_string); // искать $button->click_by_number(0); // разберём данные $res_urls = ya_parse($separator); // если нет ссылок останавливаем скрипт if($res_urls=="") { debug_mes("нет ссылок!!!"); $app->quit(); } // переходим на проверку тиц $browser->navigate("http://www.raskruty.ru/tools/cy/"); // зададим urls $textarea->set_inner_text_by_name("urrrls",$res_urls); // проверим $button->click_by_inner_text("Проверить тИЦ",false); // получить ссылки с тиц больше лимита $res_urls=get_urls_tz($tz_limit,$separator); // переходим на проверку активных ссылок $browser->navigate("http://webmasters.ru/tools/tracker"); // задать сайт для проверки $input->set_value_by_name("url",$search_site); // задать url-s не больше 100 штук $textarea->set_value_by_name("urls",$res_urls); // проверить $button->click_by_inner_text("Поехали",false); // ждём пока отработает sleep(3); // получить только активные ссылки $res_urls = get_links_res($separator); // пауза перед записью в файл sleep(1); // записать результат в файл $textfile->write_file("res\\ya.".$search_site.".txt",$res_urls,60); // сообщим о завершении debug_mes("<b>выполнили!!</b>"); // Quit $app->quit(); |
Скрипт написан 16.07.2012 в Human Emulator 4.4.19 Advanced.
Скрипт исправлен 08.04.2013 в Human Emulator 4.6.5 Advanced.