Data Mining



Data Mining

Глава 2 Программное обеспечение для работы с нейронными сетями



Программное обеспечение, имитирующее работу нейронной сети, называют нейросимулятором либо нейропакетом.
Большинство нейропакетов включают следующую последовательность действий:
•              Создание сети (выбор пользователем параметров либо одобрение установленных по умолчанию).
•              Обучение сети.
• Выдача пользователю решения.
Существует огромное разнообразие нейропакетов, возможность использования нейросетей включена также практически во все известные статистические пакеты.

Среди специализированных нейропакетов можно назвать такие: BrainMaker, NeuroOffice, NeuroPro, и др.
Критерии сравнения нейропакетов: простота применения, наглядность представляемой информации, возможность использовать различные структуры, скорость работы, наличие документации. Выбор определяется квалификацией и требованиями пользователя.

Пример решения задачи
Пример решения задачи 2
Пример решения задачи 3


Пример решения задачи 4
Пример решения задачи 5
Пример решения задачи 6
Пакет Matlab

Пакет Matlab 2
Классификация нейронных сетей
Подготовка данных для обучения
Выбор структуры нейронной сети
Карты Кохонена
Задачи, решаемые при помощи карт Кохонена
Обучение сети Кохонена
Обучение сети Кохонена 2
Обучение сети Кохонена 3
Обучение сети Кохонена 4

Обучение сети Кохонена 5
Обучение сети Кохонена 6
Обучение сети Кохонена 7
Обучение сети Кохонена 8
Карты входов
Карты входов 2
Карты входов 3
Выводы
Выводы 2
Выводы 3

 Выводы 4
Выводы 5
Методы кластерного анализа
Иерархические методы кластерного анализа
Иерархические методы кластерного анализа 2
Меры сходства
Иерархический кластерный анализ в SPSS
Иерархический кластерный анализ в SPSS 2
Определение количества кластеров
Алгоритм k-средних (k-means)

Описание алгоритма
Описание алгоритма 2
Описание алгоритма 3
Алгоритм PAM ( partitioning around Medoids)
Предварительное сокращение размерности
Факторный анализ
Итеративная кластеризация в SPSS
Итеративная кластеризация в SPSS 2
Сравнительный анализ иерархических и неиерархических методов кластеризации
Новые алгоритмы и некоторые модификации алгоритмов кластерного анализа

Алгоритм BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies)
Алгоритм WaveCluster
Алгоритм CLARA (Clustering LARge Applications)
Введение в ассоциативные правила
Введение в ассоциативные правила 2
Введение в ассоциативные правила 3
Границы поддержки и достоверности ассоциативного правила
Методы поиска ассоциативных правил
Методы поиска ассоциативных правил 2
Разновидности алгоритма Apriori

AprioriHybrid
Пример решения задачи поиска ассоциативных правил
Пример решения задачи поиска ассоциативных правил 2
Пример решения задачи поиска ассоциативных правил 3
Пример решения задачи поиска ассоциативных правил 4
Визуализатор "Правила"
Визуализатор "Правила" 2
Визуализатор "Правила" 3
Визуализация инструментов Data Mining
Визуализация Data Mining моделей

Методы визуализации
Представление данных в одном, двух и трех измерениях
Представление данных в 4 + измерениях
Параллельные координаты
Лица Чернова
Лица Чернова 2
Качество визуализации
Представление пространственных характеристик
Основные тенденции в области визуализации
Разработка сложных видов диаграмм.

Повышение уровня взаимодействия с визуализацией пользователя.
Увеличение размеров и сложности структур данных, представляемых визуализацией.
Выводы
Выводы 2
Классификация СППР
OLAP-системы
OLAP-продукты
OLAP-продукты 2
Интеграция OLAP и Data Mining
Хранилища данных

Преимущества использования хранилищ данных
Преимущества использования хранилищ данных 2
Анализ предметной области
Постановка задачи Data Mining включает следующие шаги:
Подготовка данных
Определение и анализ требований к данным
Сбор данных
Предварительная обработка данных
Предварительная обработка данных 2
Очистка данных

Анализ данных.
Выводы
Инструменты очистки данных
Инструменты очистки данных 2
Инструменты ETL
Инструменты ETL 2
Инструменты ETL 3
Инструменты ETL 4
Выводы по подготовке данных
Моделирование

Виды моделей
Виды моделей 2
Математическая модель
Построение модели
Построение модели 2
Проверка и оценка моделей
Выбор модели
 Применение модели
Погрешности в процессе Data Mining
Организационные Факторы

Человеческие факторы. Роли в Data Mining
Человеческие факторы. Роли в Data Mining 2
Человеческие факторы. Роли в Data Mining 3
CRISP-DM методология
CRISP-DM методология 2
CRISP-DM методология 3
Стандарт PMML
Стандарты, относящиеся к унификации интерфейсов
Поставщики Data Mining
Поставщики Data Mining 2

Поставщики Data Mining 3
Классификация инструментов Data Mining
Программное обеспечение Data Mining для поиска ассоциативных правил
Программное обеспечение для решения задач кластеризации и сегментации
Свободно распространяемые инструменты
Выводы
Обзор программного продукта
Графический интерфейс (GUI) для анализа данных
Инструментарий для углубленного интеллектуального анализа данных
Набор инструментов для подготовки, агрегации и исследования данных

Интегрированный комплекс разнообразных методов моделирования
Интегрированные средства сравнения моделей и пакеты результатов
Скоринг по модели и простота развертывания модели
Гибкость благодаря открытости и расширяемости
Основные характеристики пакета SAS Enterprise Miner 5.1
Основные характеристики пакета SAS Enterprise Miner 5.1 2
Основные характеристики пакета SAS Enterprise Miner 5.1 3
Основные характеристики пакета SAS Enterprise Miner 5.1 4
Основные характеристики пакета SAS Enterprise Miner 5.1 5
Управление временными метриками при помощи описательных данных

Управление временными метриками при помощи описательных данных 2
Управление временными метриками при помощи описательных данных 3
Двухуровневое моделирование • Последовательное и параллельное моделирование для классовых и интервальных целевых признаков. • Выбор модели в виде дерева решений, регрессии или нейронной сети на ка