Краткая характеристика алгоритмов классификации
Алгоритмы Naive Bayes (NB):
• Работает быстрее, чем ABN (по времени построения модели).
• Этот алгоритм лучше использовать для числа атрибутов < 200.
• Точность алгоритма меньше, чем в ABN.
Adaptive Bayes Network (ABN):
• Этот алгоритм лучше для большого числа атрибутов.
• Наглядность модели (генерация правил).
• Более точные модели, чем в NB.
• Больше параметров настройки.
Support Vector Machine.
Регрессия
Регрессия применяется для прогнозирования непрерывных величин. Простейшим случаем является линейная регрессия. Используется также метод Support Vector Machine.
Поиск существенных атрибутов
Основная задача - выявление атрибутов, наиболее важних для прогнозирования целевых значений. Используется для ускорения процесса построения классификационной модели.
Используемый алгоритм - Minimum Descriptor Length (MDL).
Дескрипторные модели