Ruby On Rails in UA Icon_home Главная Add to bookmarks Translate translate Profile Войти
Регистрация Форум Блоги Пользователи Ресурсы Список джемов      Поиск   

Ruby On Rails in UA/Code Review, Вопросы по теории программирования/Регулярные выражения

2008-06-09 23:59:03 Ответить  
admin
Ruslan Voloshin
Адрес: odessa
Сообщений: 1011
Регистр: 2007-03-13
его блог 31 сообщ.
  •  
Регулярные выражения
,
2008-06-09 14:13:58 Ответить  
admin
Ruslan Voloshin
Адрес: odessa
Сообщений: 1011
Регистр: 2007-03-13
его блог 31 сообщ.
  •  
Проверка валидности емайл
2008-06-09 22:50:19 Ответить  
admin
Ruslan Voloshin
Адрес: odessa
Сообщений: 1011
Регистр: 2007-03-13
его блог 31 сообщ.
  •  
Класификация текста по Байесовским алгоритмам
Применимость Байесовского классификатора для задачи определения спама

Наивный Байесовский классификатор

Байесовский классификатор основан на использовании знаменитой теоремы Байеса, и первые упоминания о нем можно встретить еще в 1960-м году. За уже более чем 40-летнюю историю НБК использовался для решения самых разнообразных задач: от классификации текстов в новостных агентствах до первичной диагностики заболеваний в медицинских учреждениях.

При постановке задачи для НБК в качестве характеристик обычно выбирается наличие или отсутствие каких либо слов в документе, то есть за множество характеристик T принимается множество всех слов в обрабатываемых документах. Таким образом, вес характеристики wi=1 в том случае, если слово ti было найдено, и wi=0 в обратном случае. В случае с фильтрами, которые используются для классификации спама, учитывается еще и область, в которой встретилось слово: заголовки, тема письма (subject), тело письма. То есть слово 'спам', встретившееся в теме письма, есть иной термин, чем слово 'спам' в теле письма.


,
Назадназад Новыйновый Ответитьответить
Ключевые слова:
Гости: 32 Онлайн: 0
Rambler's Top100
О проекте по всем вопросам обращайтесь на support
Rubyclub.com.ua Copyright © 2007 - 2008