О курсе
Курс очень постепенно от простого к сложному погружает профессионалов из не-технических наук (менеджмент, бизнес, гуманитарии, лингвисты, психологи, социологи, культурологи, экономисты, политтехнологи и т.д.) в захватывающий анализа данных и поиска скрытых закономерностей и методов прогностической аналитики – и поможет легко в нем ориентироваться, пользоваться и не бояться.
Курс также подойдет для профессионалов инженерно-технических специальностей, которые не изучали анализ данных, но хотят в нем разобраться — без непонятных формул и громоздких расчетов.
В основе курса самые современные материалы, демонстрирующие возможности использования программы SPSS в разных областях (маркетинговые и социологические исследования, исследования персонала, опросы мнений, разработка психодиагностического инструментария и тестов, анализ и прогнозирование и т.д.)
Чему вы научитесь?
- Загрузка и импорт данных из разных источников
- Преобразование и чистка данных, подготовка массива к анализу
- Описательные статистики: среднее, мода, медиана, квартили и т.д.
- Прогностическаяпредиктивная аналитика
- Поиск различий между группами
- Идентификация скрытых взаимосвязей между переменными
- Классификационные задачи (отдастне отдаст кредит, купитне купит товар и т.д.), построение нейросетей
- Анализ временных рядов, поиск закономерностей и прогнозирование
- Основы работы с синтаксисом
- Другие возможности программы SPSS
Содержание курса
Введение
-
Слово автора
-
Просто зашли поинтересоваться ради интереса?
-
Предупреждение перед курсом
-
Как мы будем учиться
Не об spss: основные не-технические понятия
-
Вступление к разделу
-
Описательная и аналитическая статистика
-
Важность моделей в аналитике
-
Без модели: разведочный анализ данных (рад) и data mining
-
Выборка и генеральная совокупность
-
Расчет объема выборки
-
Комплексный кейс: репрезентативность и размер выборки
-
Массив данных
-
Объекты анализа (строки)
-
Переменныехарактеристики
-
Типы шкал для переменных
-
Тип данных для значений переменных
-
Требования к записи значений в массиве
-
Осознание массива
-
Понятие статистической гипотезы
-
Формулировка гипотез
-
Вероятность ошибки и уровень значимости
-
Нормальное распределение
-
Параметрика и непараметрика
-
Функциональные и вероятностные взаимосвязи
-
Процесс анализа данных в организации
-
Итоги раздела
-
Тестирование по итогам раздела
Знакомство с spss
-
Подготовка рабочего пространства: установка инструментария
-
Основные элементы интерфейса
-
Закладкапредставление данные
-
Закладкапредставление переменные
-
Элемент-невидимка: контекстное меню
-
Лента — главная управляющая часть программы (+панель быстрого доступа)
-
Окно вывода результатов анализа: выводoutput
-
Свой собственный язык: окно синтаксиса
-
Итоги раздела
-
Интерфейс
-
Познакомиться с интерфейсом собственноручно
Основы для быстрого старта
-
Вступление к разделу
-
Ввод переменных: создание паспорта массива
-
Паспортизация
-
Ввод данных: значения переменных
-
Массивность
-
Обратный ход: загрузка готового массива и правка переменных
-
Суть подготовки данных к анализу
-
Готовность
-
Суть анализа данных
-
Анализатор
-
Суть визуализации данных
-
Визуализатор: не таблицами едиными
-
Экспорт результатов анализа
-
Экспорт
-
Итоги раздела
Подготовка данных к анализу: загрузка, чистка и трансформацияпреобразование
-
Вступление
-
Извлечение и загрузка данных: чтение и импорт
-
Загрузка готового массива
-
Редактирование переменных
-
Самостоятельно откорректировать переменные
-
Упорядочивание переменных
-
Попередвигаем
-
Удаление переменных (столбцов)
-
Удалить ненужное
-
Отображение значений переменных
-
Две стороны одной медали
-
Фильтрацияотбор наблюдений (строк) для анализа
-
(не)естественный отбор
-
Ремонт выборки с помощью отбора наблюдений
-
Расщепление массива: автоматический отбор наблюдений в разрезе виртуальных групп
-
Расщепление
-
Сортировка наблюдений (строк)
-
Сортировщик
-
Удаление строк
-
Строчная «аннигиляция»
-
Обнаружение и чистка дубликатов
-
Дублировка
-
Обнаружение ошибок ввода и работа с ними
-
Примитив: простой способ поиска ошибок
-
Обнаружение ошибок ввода смысловым способом
-
Смысловуха
-
О работе с пропущенными значениями
-
Пропущенные значения: наблюденияслучаиобъекты (строки)
-
Пропуски по наблюдениямобъектам (строкам)
-
Пропущенные значения: переменные (столбцы)
-
Пропуски по переменным (столбцам)
-
Описательная и аналитическая статистика
-
Ранжировка
-
Множественные ответы: виртуальная переменная
-
Виртуальное множество
-
Транспонирование массива
-
Транспонирование (смена столбцов и строк местами)
-
Взвешивание данных: работа с агрегированным массивом
-
Весовик для агрегата
Описательные статистики
-
Суть описательных статистик
-
Частотный анализ (частотное распределение)
-
Интересные частоты
-
Частоты под несколько переменных: таблицы сопряженности (перекр.Классификации)
-
Интересные частоты: кросстабы
-
Частоты для множественных ответоввыбора
-
Множество к единству
-
Turf-анализ
-
Turfология
-
4 группы мер в описательной статистике
-
Меры центральной тенденции: среднее, мода, медиана
-
Pp-qq
-
Комплексный обзор данных (data explore)
-
Обзорный подход
-
Метрикисоотношения (ratio)
-
Процентажи
-
Настраиваемые сводные таблицыотчеты (custom tables)
-
Сводка
-
Визуализации: диаграммы
-
Визуал
-
Итоги раздела
Аналитическая статистика: что это?
-
Отличие от описательной статистики
-
3+1 основных блока аналитических задач
-
Возвращение к истокам: модель, рад и data mining
-
Возвращение к истокам: гипотезы, вероятность ошибки и значимость
-
Проверка распределения переменных на соответствие нормальному распределению
-
Проверка на нормальное распределение: устаревшие окна для любых версий spss
-
Итоги раздела
Аналитическая статистика: различия между группами
-
Для чего это применяется?
-
Снова параметрика и непараметрика
-
Еще раз о значимости различий между группами
-
Зависимые (парные, связанные) и независимые выборки
-
Базовый инструмент сравнения групп: таблицы сопряженности и критерий хи-квадрат
-
Сравнение групп: хи-квадрат
-
Сравнение 2 независимых групп (выборок): т-тест, параметрика
-
T-тест для средних (параметрика)
-
Сравнение 2-х независимых групп (выборок): непараметрика
-
Непараметрика для сравнения 2 независимых выборок: манн-уитни
-
Много независимого
-
Сравнение групп при анализе пропущенных значений
-
Сравнение 2-х парных (связанных) групп/выборок: т-тест, параметрика
-
Парная параметрика
-
Сравнение 2-х парных (связанных) групп/выборок: непараметрика
-
Парная непараметрика
-
Сравнение множества парных выборок
-
Парное множество
-
Итоги раздела
Частный случай сравнения групп: одновыборочные сравнительные тесты
-
Одновыборочные сравнительные тесты
-
T-тест для средних (параметрика)
-
Параметрика для одной выборки
-
Общий обзор окна с одновыборочными тестами для непараметрики
-
Биномиальный тест (непараметрика)
-
Биномиал
-
Хи-квадрат тест (непараметрика)
-
Квадратное хи
-
Тестирование формы распределения (непараметрика)
-
Кс-норма
-
Знаковый (медианный) тест уилкоксона
-
Знак уилкоксона
-
Случайна или нет последовательность значений (непараметрика)
-
Биржа
-
Итоги раздела
Аналитическая статистика: связи между переменными
-
Причинно-следственная связь, а также зависимые и независимые переменные
-
Рассуждения о связях между переменными
-
И еще раз о том, что такое значимая статистическая взаимосвязь
-
Суть корреляции переменных
-
Снова таблицы сопряженности: только для проверки связи
-
Связь через кросстабы
-
Проверка формы связи
-
Форма
-
Корреляционный анализ: сила, направление, значимость
-
Сила связи не значимость
-
Работа с ложными корреляциями
-
Распознать ложь
-
Суть регрессионного анализа
-
Факторный анализ
-
Факторизация
-
Анализ надежности-согласованности (пригодности)
-
Пригодность
-
Многомерное шкалирование
-
Многомерка
-
Итоги раздела поиска скрытых взаимосвязей между переменными
Аналитическая статистика: классификация объектов
-
Для чего это применяется?
-
Логистическая регрессия
-
Логистика
-
Полиномиальная логистическая регрессия
-
Множественная логистика
-
Порядковая регрессия
-
Порядок
-
Пробит-анализ
-
Проба
-
Дискриминант
-
Деревья решенийклассификации
-
Дерево
-
Roc-классификатор (receiver operating characteristic)
-
Roc
-
Нейронные сети: многослойный перцептрон (mlp)
-
Нейронка
-
Итоги классификации с «высоты птичьего полета»
Аналитическая статистика: основы прогнозирования временных рядов
-
Вступление, предназначение и оговорки о предметной области
-
Главная ловушка при прогнозировании во времени
-
Основные задачи анализа временных рядов
-
Компоненты временных рядов: тренд, сезонность, цикл, всплеск
-
Отправная точка анализа трендов: посмотреть на график «на глазок»
-
Старт времен
-
Анализ временного ряда: линия тренда с прогнозом и «коридор» прогноза
-
Трендовик
-
«проявление» тренда с помощью скользящего среднего
-
Скольжение
-
Сезонная декомпозиция
-
Сезонка
-
Авто- и кросскорреляции
-
Временная корреляция
-
Итоги раздела
Основы синтаксиса: знакомство с внутренним языком spss
-
Что такое синтаксис и чем может быть полезен бизнес-пользователю
-
Открытие, наполнение, запуск и сохранение окна синтаксиса
-
Переименование и удаление переменных (rename variables и delete variables)
-
Удаление переменных и смена их имен
-
Вычисление переменных (compute)
-
Вычисление
-
Условные операторы if, and и or
-
Условности
-
Перекодировка переменных (recode с to, into и else)
-
Перекод
-
Основные функции-агрегаторы (sum, mean, count, min, max)
-
Агрегации
-
Комментарии в синтаксисе(* или /*)
-
Комментатор
-
Зачем забирать синтаксис прямо из пользовательского интерфейса и уметь править?
-
Итоги раздела
Краткий обзор отдельных возможностей spss и ее «родственников»
-
Проверка стабильности и надежности моделей: bootstrapping
-
Байесовская вероятность и статистика
-
Как быстро «найти менюшки» в spss
-
Структурное моделирование
-
Публикация результатов анализа на web: cdsr
-
Создание, операционализация и поставка моделей: spss modeler и watson studio
-
Итоги раздела