Анализ больших данных. Рабочая программа дисциплины. по направлению подготовки 38.04.05 Бизнес-информатика.



МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ВЛАДИВОСТОКСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ЭКОНОМИКИ И СЕРВИСА



КАФЕДРА ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ И СИСТЕМ







АНАЛИЗ БОЛЬШИХ ДАННЫХ

Рабочая программа дисциплины


по направлению подготовки
38.04.05 Бизнес-информатика

тип ОПОП: магистратура






















Владивосток 2016



Рабочая программа дисциплины «Анализ больших данных» составлена в соответствии с требованиями ФГОС ВО по направлению подготовки 38.04.05 «Бизнес-информатика» и Порядком организации и осуществления образовательной деятельности по образовательным программам высшего образования – программам бакалавриата, программам специалитета, программам магистратуры (утв. приказом Минобрнауки России от 19 декабря 2013 г. N 1367)


Составитель: Ермолицкая М.З., к.б.н., доцент кафедры информационных технологий и систем, [email protected]



Утверждена на заседании кафедры ИТС от 20.04.2016 г., протокол № 9.




Заведующий кафедрой (разработчика) _____________________ Кийкова Е.В.
подпись фамилия, инициалы
«__» ___________ 2016 г.





Заведующий кафедрой (выпускающей) _____________________ _ Кийкова Е.В. подпись фамилия, инициалы
«____»_______________2016 г.










1. Цель и задачи освоения дисциплины
Целью освоения дисциплины «Анализ больших данных» является теоретическая и практическая подготовка студентов к работе с большими данными при решении экономических задач. Знания, полученные в результате освоения дисциплины, помогут при выборе методик анализа больших данных и визуализации полученных результатов. Все это необходимо выпускнику, освоившему программу магистратуры, для решения различных задач практической и научно-исследовательской деятельности.
Задачи освоения дисциплины состоят в формировании общепрофессиональных компетенций, позволяющих решать задачи профессиональной деятельности, связанные с анализом больших данных, с применением методов системного анализа и с использованием программы R-Studio.

2. Перечень планируемых результатов обучения по дисциплине, соотнесенных с планируемыми результатами освоения образовательной программы
Планируемыми результатами обучения по дисциплине «Анализ больших данных» являются знания, умения, владения, характеризующие уровни формирования компетенций и обеспечивающие достижение планируемых результатов освоения образовательной программы в целом. Перечень компетенций, формируемых в результате изучения дисциплины, приведен в таблице 1.

Таблица 1 – Формируемые компетенции
Название ОПОП (сокращенное название)
Компетенции
Название компетенции
Составляющие компетенции

38.04.05 Бизнес-информатика




ПК-3
Способность применять методы системного анализа и моделирования для анализа, архитектуры предприятий
Знания:
методов системного анализа для решения экономических задач с большими данными





Умения:
использовать методы системного анализа для решения экономических задач с большими данными




Владения:
основными методами системного анализа для решения экономических задач с большими данными


ПК-10
Способность проводить исследования и поиск новых моделей и методов совершенствования архитектуры предприятия
Знания:
об основных методах статистического анализа больших данных




Умения:
использовать аппарат математической статистики для анализа экономических данных




Владения:
методами математической статистики,
навыками применения программы R-Studio для анализа данных


3. Место дисциплины в структуре основной образовательной программы

Отнесение дисциплины к вариативной части ОПОП определяется спецификой и миссией ВГУЭС, а также особенностями взаимодействия ВГУЭС с рынком труда и региональными требованиями, выраженными в результатах образования и компетенциях.
Входными требованиями к изучению дисциплины «Анализ больших данных» является наличие у студентов компетенций, сформированных на предыдущем уровне образования и непосредственно связанных с дисциплинами общепрофессионального цикла (теория вероятностей и математическая статистика, информатика и основы программирования).
Компетенции, приобретенные при освоении дисциплины «Анализ больших данных» могут быть использованы в практической и научно-исследовательской деятельности, а также при выполнении дипломных работ студентов.

4. Объем дисциплины
Объем дисциплины в зачетных единицах с указанием количества академических часов, выделенных на контактную работу с обучающимися (по видам учебных занятий) и на самостоятельную работу по всем формам обучения, приведен в таблице 2.

Название ОПОП
Форма обучения
Цикл
Семестр
курс
Трудоемкость
Объем контактной работы (час)
СРС
Форма аттестации





(З.Е.)
Всего
Аудиторная
Внеаудитор
ная









лек
прак
лаб
ПА
КСР



М-БИ
ОФО
М1.В
3 семестр
3
33
8
16
-
9
-
75
Экзамен

Таблица 2 – Общая трудоемкость дисциплины

5. Структура и содержание дисциплины
5.1 Структура дисциплины
Тематический план, отражающий содержание дисциплины (перечень разделов и тем), структурированное по видам учебных занятий с указанием их объемов в соответствии с учебным планом, приведен в таблице 3.

Таблица 3 – Структура дисциплины

Название темы
Вид занятия
Объем час
Кол-во часов в интерактивной и
электронной
форме
СРС

1
Ведение в анализ больших данных. Методики анализа больших данных.
Лекция
2
-
10

2
Статистические методы анализа данных.
Лекция
6
-
20

3
Знакомство с программой R-Studio. Представление данных.
Практическая работа
4
4
20

4
Применение методов математической статистики для анализа данных.
Практическая работа
12
12
25


5.2 Содержание дисциплины
5.2.1 Содержание теоретической части
Тема 1. Ведение в анализ больших данных. Методики анализа больших данных.
Содержание темы. Основные определения, термины, задачи анализа больших данных. Понятие Data Mining. Системный анализ и методы его проведения. Методики анализа больших данных: A/B testing, association rule learning, classification и другие.
Тема 2. Статистические методы анализа данных.
Содержание темы. Статистические методы анализа данных: дескриптивная статистика, параметрические, непараметрические, номинальные методы (корреляционный, регрессионный, дисперсионный анализы, кластерный, дискриминантный, факторный анализы).

Литература по темам 1-2:
Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие для бакалавров. - М.: Юрайт: ИД Юрайт, 2012. – 479 с.
[ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ]. -Издательство: Флинта, 2011 г. – 220 с.- http://rucont.ru/efd/246481
Волкова П.А., Шипунов А.Б. Статистическая обработка данных в учебно исследовательских работах. – М.: Форум, 2012. – 96 с.
[ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ]. -Издательство: ЮНИТИ-ДАНА, 2012. – 551 с.
[ Cкачайте файл, чтобы посмотреть ссылку ] Основы эконометрики в пакете Statistica: учебное пособие для вузов. – М.: Вузовский учебник, 2011. – 297 с.
Теория вероятностей и математическая статистика: учебное пособие для студентов вузов / под ред. В.И. Ермакова. – М.: ИНФРА-М, 2012. – 287 с.
Шумак О.А., Гераськин А.В. Статистика: учебное пособие для студентов вузов. – М.: РИОР: ИНФРА-М, 2012. – 311 с.

Формы и методы проведения занятий по темам, применяемые образовательные технологии. Лекции, на которых дается основной систематизированный материал по темам.
Форма текущего контроля: Вопросы по теме.
Виды самостоятельной подготовки студентов по теме. Чтение предлагаемой преподавателем литературы и использование интернет-ресурсов.

5.2.2 Содержание практической части дисциплины
Тема 3. Знакомство с программой R-Studio. Представление данных.
Содержание темы. Программа R-Studio: основные принципы организации среды R, работа с командной консолью. Типы данных (векторы, массивы, матрицы, факторы, списки, таблицы). Представление даты и времени. Организация вычислений.
Тема 4. Применение методов математической статистики для анализа данных.
Содержание темы. Группировка данных, обнаружение значимых корреляций, зависимостей и тенденций в результате анализа имеющейся информации, выявления отношений между данными различного типа. Применение различных методов выделения, извлечения и группировки данных, которые позволяют выявить систематизированные структуры данных и вывести из них правила для принятия решений и прогнозирования их последствий (регрессионный, дисперсионный, кластерный, дискриминантный, факторный анализы). Возможности графического представления информации в программе R-Studio: графические функции отображения одномерных и многомерных данных, графический вывод с использованием графических параметров.

Литература по темам 3-4:
Вуколов Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistica и EXCEL: учебное пособие для студентов вузов. – М.: ФОРУМ: ИНФРА-М, 2013. – 464 с.
Волкова П.А., Шипунов А.Б. Статистическая обработка данных в учебно исследовательских работах. – М.: Форум, 2012. – 96 с.
Зарядов И. С. Введение в статистический пакет R: типы переменных, структуры данных, чтение и запись информации, графика. М.: Издательство Российского университета дружбы народов, 2010. - 207 с. 
Зарядов И. С. Статистический пакет R: теория вероятностей и математическая статистика.  М.: Издательство Российского университета дружбы народов, 2010. - 141 с. 
Зорин А. В., Федоткин М. А. Введение в прикладной статистический анализ в пакете R. Учебно-методическое пособие. Нижний Новгород: Нижегородский гос. ун-т им. Н. И. Лобачевского, 2010. - 50 с. 
Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! - М.: ДМК Пресс, 2012. - 298 с


Формы и методы проведения занятий по темам, применяемые образовательные технологии. Практические занятия проводятся в компьютерном классе с использованием программы R-Studio. Преподаватель излагает тему, приводит примеры и дает задание для самостоятельного выполнения. При необходимости, консультирует студентов.
Форма текущего контроля. Выполнение заданий на ПЭВМ. Вопросы по заданию.
Виды самостоятельной подготовки студентов по теме. Чтение предлагаемой преподавателем литературы и использование интернет-ресурсов.

6. Методические указания для обучающихся по освоению дисциплины
Программой дисциплины «Анализ больших данных» предусмотрено чтение лекций, проведение практических занятий, консультаций и самостоятельная работа студентов для формирования и развития профессиональных навыков обучающихся. На лекционных занятиях дается основной систематизированный теоретический материал. На практических занятиях под руководством преподавателя студенты получают навыки работы с программой R-Studio, а также приобретают умения применять на практике методы математической статистики для анализа больших данных. Самостоятельная работа студентов заключается в изучении предлагаемой литературы для усвоения и углубления полученных аудиторных знаний. Предусмотренная форма аттестации – экзамен.

Контрольные вопросы для самостоятельной оценки качества освоения учебной дисциплины:
Сущность системного подхода и его применение в экономике.
Методы системного анализа.
Определите сущность понятия «большие данные».
Опишите методики анализа больших данных.
Процесс аналитики анализа больших данных.
Дайте характеристику Big Data на мировом рынке.
Охарактеризуйте Big Data в России.
Определите понятие Data Mining.
Определите различия между параметрическими, непараметрическими и номинальными методами.
Опишите основную идею корреляционного анализа.
Регрессионный анализ.
Основная идея дисперсионного анализа.
Сущность кластерного анализа.
Дискриминантный анализ: модель и общая процедура выполнения.
Цели факторного анализа.
Преимущества работа с данными в программе R-Studio.
Представление исходных данных в программе R-Studio.
Выполнение анализа данных в R-Studio.

Для самостоятельной подготовке к занятиям рекомендуется использовать предложенную литературу (п.9 данной программы) и информационные ресурсы сети Интернет (п.10).

7. Перечень учебно-методического обеспечения для самостоятельной работы
Для повышения эффективности самостоятельной работы студентов в библиотеке университета имеется предложенная данной программой учебная и научная литература по дисциплине. Кроме того, каждый обучающийся обеспечен доступом к электронно-библиотечной системе и информационно-телекоммуникационной сети Интернет. Электронно-образовательная среда университета обеспечивает доступ к учебно-методическим материалам дисциплины, к электронным изданиям и электронно-образовательным ресурсам.

8. Фонд оценочных средств для проведения промежуточной аттестации
В соответствии с требованиями ФГОС ВО для аттестации обучающихся на соответствие их персональных достижений  планируемым результатам обучения по дисциплине созданы фонды оценочных средств (Приложение 1).

9. Перечень основной и дополнительной учебной литературы, необходимой для освоения дисциплины
а) основная литература
Вуколов Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistica и EXCEL: учебное пособие для студентов вузов. – М.: ФОРУМ: ИНФРА-М, 2013. – 464 с.
Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие для бакалавров. - М.: Юрайт: ИД Юрайт, 2012. – 479 с.
[ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ]. -Издательство: ЮНИТИ-ДАНА, 2012. – 551 с.
Теория вероятностей и математическая статистика: учебное пособие для студентов вузов / под ред. В.И. Ермакова. – М.: ИНФРА-М, 2012. – 287 с.
Шумак О.А., Гераськин А.В. Статистика: учебное пособие для студентов вузов. – М.: РИОР: ИНФРА-М, 2012. – 311 с.

б) дополнительная литература
Волкова П.А., Шипунов А.Б. Статистическая обработка данных в учебно исследовательских работах. – М.: Форум, 2012. – 96 с.
Зарядов И. С. Введение в статистический пакет R: типы переменных, структуры данных, чтение и запись информации, графика. М.: Издательство Российского университета дружбы народов, 2010. - 207 с. 
Зарядов И. С. Статистический пакет R: теория вероятностей и математическая статистика.  М.: Издательство Российского университета дружбы народов, 2010. - 141 с. 
Зорин А. В., Федоткин М. А. Введение в прикладной статистический анализ в пакете R. Учебно-методическое пособие. Нижний Новгород: Нижегородский гос. ун-т им. Н. И. Лобачевского, 2010. - 50 с. 
[ Cкачайте файл, чтобы посмотреть ссылку ] Основы эконометрики в пакете Statistica: учебное пособие для вузов. – М.: Вузовский учебник, 2011. – 297 с.
Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! - М.: ДМК Пресс, 2012. - 298 с.

10. Перечень ресурсов информационно-телекоммуникационной сети «Интернет»
а) полнотекстовые базы данных
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]

б) интернет-ресурсы
Единое окно доступа к образовательным ресурсам - ([ Cкачайте файл, чтобы посмотреть ссылку ])
«Введение в R» -https://m7876.wiki.zoho.com/Introduction-to-R.html
Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. - Электронная книга, адрес доступа: [ Cкачайте файл, чтобы посмотреть ссылку ]
Статьи по Big Data - [ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ]. -Издательство: Флинта, 2011 г. – 220 с. - http://rucont.ru/efd/246481
ЭБС znanium.com издательства «ИНФРА-М»

11. Перечень информационных технологий, используемых при осуществлении образовательного процесса по дисциплине
Практические работы по данной дисциплине выполняются на ПЭВМ с использованием программы R-Studio.
12. Электронная поддержка дисциплины
При изучении дисциплины студенты могут использовать различные учебно-методические материалы, размещаемые в электронном виде преподавателями на студенческом файловом сервере, в хранилище полнотекстовых материалов, а также в электронной образовательной среде, которая предполагает также возможность обмена информацией с преподавателем для подготовки заданий. Доступ студентов к студенческому файловому серверу, хранилищу полнотекстовых материалов, электронной образовательной среде осуществляется с использованием с использованием учетных записей студентов.

13. Материально-техническое обеспечение дисциплины
Для успешного освоения предлагаемых тем с целью формирования и развития профессиональных навыков обучающихся практические занятия проводятся в компьютерном классе с использованием программы R-Studio.















'ђ Заголовок 1 Заголовок 2 Заголовок 3 Заголовок 4 Заголовок 5 Заголовок 6!, Знак Знак3

Приложенные файлы

  • doc 11778911
    Размер файла: 144 kB Загрузок: 0

Добавить комментарий