| 2008-06-10 09:10:22 | Ответить |
|---|---|
|
Ruslan Voloshin Адрес: odessa Сообщений: 1226 Регистр: 2007-03-13 его блог 40 сообщ. |
Получаем колличество проинтексированых страниц Яндексом |
|
Стало интересно посмотреть что может Hpricot, и решил сделать парсинг страницы для получения количества проиндексированых ссылок ботом. Для этого надо получить и распарсить страницу с яндекса.
------------
http://www.yandex.ru/yandsearch?serverurl=http://fotolife.com.ua&lr=187 Для этого сначала ставим джем По мимо парсинга страницы нам понадобиться еще и получить страницу, для этого будем использовать стандартные библиотеки. #link.rb После чего можно запустить файлик и в результате увидим количество проиндексированых страниц. Hpricot позволяет искать в html, xml даже с использованием XPath Занимаюсь вебом и продвижением сайтов.
|
|
| get remote page, Hpricot rails, parse html, parse html page, parse xml, ruby XPath |