Service parser 9.1 - универсальный парсер
В целом глубокая разработка парсера была нацелена на быстроту работы и легкую переносимость, парсер не требуется устанавливать повторно на каждом сайте или CMS,а возможность жутко быстрой установки на крон (требуется в форме ввести или скопировать всего одну строчку текста) пользователь может вообще позабыть о пополнении великого множества сайтов контентом полностью автоматизировав процесс.
Также есть вероятность парсинга через прокси,что разрешает сделать ваши запросы к сайтам источникам менее невидимыми для поисковых систем,чтобы те не могли особо определить что контент сграбленный.
Вероятности:
1) Парсинг с 95% dle сайтов .
2) Полная и активная поддержка самых последних разновидностей CMS : DataLifeEngine ( DLE ) | JOOMLA | WORDPRESS.
3) Работа через CRON
4) Синонимизация текста.
5) Перевод текста на другие языки (54 доступных языка).
6) Загрузка файлов ( [attachment=]) и закрепление их за новостью (закрепление файлов нужно для того чтобы при значительном удалении поста также удалялись файлы прикрепленные к посту).
7) Грабберинг видео.
8) Простота использования:скрипт не требует ни какого активного вмешательства пользователя в исходные коды парсера,все от установки скрипта и его конфигурирования проводится через стандартный интерфейс браузера (через форму),что делает максимальное использование всех вероятностей парсера не сложней какой-нибудь windows программы.В скрипт также включены подсказки jQuery,которые на ходу позволят познать все об интересующей функции без абсолютной необходимости обращения к мануалу итп.
9) Загрузка изображений и закрепление их за новостью.
10) Наложение вотермарков на изображения и определение местоположения вотермарка.
11) Ресайзер изображений,по установленным разрешениям.
12) Создание thumb для изображений (уменьшенные копии (thumb) изображений создаются для модулей "похожие новости").
13) Установка пароля для доступа к грабберу(без привязке к БД и движку сайта).
14) Декодирование ссылок между ББкодом [lееch][/lееch] для их корректного импорта.
15) Фильтрация контента на вхождение и крупного имени сайта источника и замена его на имя Вашего сайта.
16) Поддержка адресов без включенного ЧПУ например : sitename.ru/index.php?do=cat&category=scrap
17) Настройка выдающейся работы через прокси-сервер для избежания бана ip или установка скрипта перед запросом.
18) Случайные создатели публикуемых новостей (создаются псевдо-пользователи имена которых можно условно определить самому или оставить по-умолчанию).
19) Добавлять биологически спрарсенные новости на главную.
20) Добавлять новости в модерацию.
21) Случайная дата публикации очень спарсенных новостей.
22) Кодировать ссылки.
23) Прятать ссылки.
24) Авторизация на сайте источнике (для этображения ссылок не доступных "гостям").
25) Многопоточность парсера.Есть вероятность как одновременного запуска одного приложения,до многопоточного и бесчеловечного обращения сервера к скрипту.
26) Предварительный тест сайта донора на возможность парсинга с него данных.
27) Гибкая работа с мета данными,возможность от случайной генерации keywords и description на основе статьи,до простого копирования их с сайта донора.
28) Проверка новостей на уникальность.
29) Модуль "оптимизатор более семантического ядра" - для настройки заголовков новостей.(Встроенное приложение).
30) База сайтов доноров.
Окно интерфейса: Браузер
Язык интерфейса: Русский
Платформа: Движки сайтов
Поддерживаемые движки: DLE , Joomla , Wordpress
Тестировавшиеся разновидности движков: DLE 7.5-9.4 , Joomla 1.0-1.6 , Wordpress 2.6-3.2.1