Визуализация инструментов Data Mining
Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.
• Для деревьев решений это визуализатор дерева решений, список правил, таблица
сопряженности.
• Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.
• Для карт Кохонена: карты входов, выходов, другие специфические карты.
• Для линейной регрессии в качестве визуализатора выступает линия регрессии.
• Для кластеризации: дендрограммы, диаграммы рассеивания.
• являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);
• помогают интерпретировать полученный результат;
• являются средством оценки качества построенной модели;
• сочетают перечисленные выше функции (дерево решений, дендрограмма).
Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.