На нашем сайте вы уже можете найти скрипт, который добавляет автоматом материалы в блог WordPress. Но как же быть если у вас обычный сайт, который использует обычный html+css. Очень просто заливать статьи на сайт через ftp.
Допустим стоит задача брать новости с заданного сайта и публиковать их у себя на сайте. Прежде всего найдём сайт донор новостей нужной тематики.
Причём найдём сайт на украинском языке, для того что бы переводить эти новости и публиковать у себя. Не забудьте проверить может быть его уже кто то переводит, а нам всё таки интересен уникальный контент.
Итак мы нашли такой сайт. Далее мы пишем разбор нужных нам страниц.
Перед этим мы уже приготовили шаблоны, по котором мы будем создавать страницы для своего сайта.
Пускай это будет сама новостная страница, страница всех новостей, и главная страница сайта.
В шаблонах мы указываем ключи для замены, как указано ниже в примере:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
<html> <head> <title>{TITLE}</title> <meta name="keywords" content="{KEYS}"> <meta name="description" content="новости"> <?include("../../top.php");?> <?include("../../mid.php");?> <h5>{TITLE}</h5> <br> {IMG}{BODY} <br><br> <i><font size="2" color="#000000">По материалам:</font></i> {SITE} <br><br><br> <a href="../../index_news.php" class="url_caption">Все новости</a> <br> <?include("../../bottom.php");?> </i> |
Не трудно догадаться, что {TITLE} — это название новости или статьи, {KEYS} — это ключи (мы их получаем из названия — берём его целиком или делим, заменяя пробелы на , ),{IMG} — это вставляемый рисунок, {BODY} — сама статья или новость, {SITE} — это источник статьи или новости его можно указывать, а можно нет.
Настройки скрипта:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
// ////////// настройки скрипта/////////////////// // настройки ftp для вашего сайта $ftp_server ="имя вашего сайта без ftp"; $ftp_user="ftp логин"; $ftp_pass="ftp пароль"; // пути к шаблонам $tmp_index="data/tmp_1.php"; $tmp_news="data/tmp_2.php"; $tmp_ind_news="data/tmp_3.php"; // папка с результатами $res_folder="res/"; // путь к папке с рисунками $img_folder="C:\\XWeb\\Human Emulator\\My Scripts\\add_news\\data\\images\\" ; // полный путь к папке с результатами для загрузки по ftp $res_folder_full="C:\\XWeb\\Human Emulator\\My Scripts\\add_news\\res\\" ; // количество добавляемых новостей за раз генерим случайным образом от 1 до 3 $cnt_news=rand(1,3); // счётчик новостей для имён новостей $founded_news=0; |
Этот скрипт запускается по расписанию каждый день без малейшего вашего участия и добавляет нужный контент на сайт автоматом. На первых парах придётся понаблюдать за ним и устранить недочёты и ошибки в работе.
Когда всё встанет на рельсы вам лишь периодически нужно будет смотреть ничего ли не изменилось на сайте доноре.
Скрипт может быть легко вами изменён, можно добавить несколько доноров. Так же можно в зависимости от количества собранных уже новостей делить страницу с новостями на подстраницы 1,2,3 и т.д. Всё ограничивается лишь вашей фантазией 🙂
Ниже приведёт пример подобного скрипта:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 |
<?php $xhe_host ="127.0.0.1:7010"; // The following code is required to properly run XWeb Human Emulator require("../../Templates/xweb_human_emulator.php"); // ////////// настройки скрипта/////////////////// // настройки ftp $ftp_server ="имя вашего сайта без ftp"; $ftp_user="ftp логин"; $ftp_pass="ftp пароль"; // пути к шаблонам $tmp_index="data/tmp_1.php"; $tmp_news="data/tmp_2.php"; $tmp_ind_news="data/tmp_3.php"; // папка с результатами $res_folder="res/"; // путь к папке с рисунками $img_folder="C:\\XWeb\\Human Emulator\\My Scripts\\add_news\\data\\images\\" ; // полный путь к папке с результатами $res_folder_full="C:\\XWeb\\Human Emulator\\My Scripts\\add_news\\res\\" ; // количество добавляемых новостей $cnt_news=rand(1,3); // счётчик новостей $founded_news=0; // режим отладки $dbg=true; // /////////////////// дополнительные модули ///////////////////// // класс работы с ftp include "ftp.php"; // функции require_once("functions.php"); // ///////////////////// script ///////////////////////////////////////////////////////// debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили"); // текущая дата $str_date=date("d.m.Y ");//"30.08.2012 ";// // переходим на сайт $browser->navigate("сайт донор новостей"); $news=$webpage->get_body_inter_prefix_all("<table class=\"contentpaneopen\">","</table>"); $a_news=explode("<br>",$news); for($i=0;$i<count($a_news)-1;$i++) { // проверим дату новости if(strpos($a_news[$i+1],$str_date)) { $founded_news++; debug_mess("нашли новость $founded_news на сайт донор новостей"); $href_news=get_string($a_news[$i],"href=\"","\">"); // название новости $title_news=$anchor->get_inner_text_by_href($href_news,false); $anchor->click_by_href($href_news,false); // получим название файла $img_src=$image->get_attribute_by_src("/images/news/",false,"src"); $img_src=str_replace("/images/news/","",$img_src); // alt рисунка $img_alt=$image->get_attribute_by_src("/images/news/",false,"alt"); // сохраним картинку $image->screenshot_by_src($img_folder.$img_src,"/images/news/",false); // разбор новости $bd = $webpage->get_body(); $bd = get_string($bd,"<img class=\"img\"","Anywhere -->"); $bd_news = get_string($bd,"</noindex>","<!-- START: Modules"); // переведём $title_news=translate($title_news); $img_alt=translate($img_alt); $bd_news=translate($bd_news); // создадим страницы для сайта create_pages($title_news,$bd_news,$img_src,$img_alt,"сайт донор новостей"); if($founded_news>=$cnt_news) break; } } debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу<br>"); // перезапустим для отчистки памяти //$app->restart(); // Quit $app->quit(); ?> |
Скрипт написан 20.09.2012 в Human Emulator 4.4.19 Advanced.
На момент публикации статьи 22.09.2012 скрипт был рабочий.