Аналіз даних в інформаційно-управляючих системах - Робоча програма навчальної дисципліни (Силабус)

Реквізити навчальної дисципліни

Рівень вищої освіти Перший (бакалаврський)
Галузь знань Інформаційні технології
Спеціальність 126 Інформаційні системи та технології
Освітня програма Інформаційні управляючі системи та технології
Статус дисципліни Вибіркова
Форма навчання очна(денна)/дистанційна/змішана
Рік підготовки, семестр 2 курс, весняний семестр
Обсяг дисципліни 4,5 кредитів
Семестровий контроль/ контрольні заходи екзамен
Розклад занять

Лекції:

п‘ятниця 3 пара (12.20-13.55)

Лабораторні заняття:

Середа 4 пара (14.15-15.50)

Мова викладання Українська
Інформація про
керівника курсу / викладачів

Лектор: к.ф.-м.н., доц., доц. кафедри АСОІУ Гавриленко О.В., gelena1980@gmail.com

Лабораторні заняття: к.ф.-м.н., доц., доц. кафедри АСОІУ Гавриленко О.В., gelena1980@gmail.com

Розміщення курсу

https://classroom.google.com/u/0/c/MTQ1MTY0NjUzNDk1,

http://moodle.asu.kpi.ua/course/view.php?id=50

https://evgavrilenko.ucoz.ru/

Програма навчальної дисципліни

  1. Опис навчальної дисципліни, її мета, предмет вивчання та результати навчання

Мета вивчення дисципліни – набуття ключових фахових компетентностей, теоретичних знань і практичних навичок з інтелектуального аналізу даних у різних сферах професійної діяльності.

Предметом вивчення дисципліни є технології, методи та засоби інтелектуального аналізу даних.

Завдання вивчення дисципліни: – оволодіння основними поняттями інтелектуального аналізу даних; – ознайомлення з новітніми інформаційними технологіями аналітичної обробки інформації; – набуття практичних навичок використання методів і засобів інтелектуального аналізу даних.

Навчальна дисципліна покликана допомогти студенту отримати:

  • знання основних понять, методів, засобів, моделей та алгоритмів інтелектуального аналізу даних;
  • розуміння принципів застосування технологій інтелектуального аналізу даних;
  • уміння вільно орієнтуватися на сучасному ринку аналітичних програмних продуктів; практично застосовувати методи консолідації, трансформації, візуалізації, оцінки якості, очищення та предобробки даних для якісної підготовки даних до аналізу; використовувати програмне забезпечення для використання процедур інтелектуального аналізу при обробці інформації;
  • здатність використовувати можливості вітчизняних і зарубіжних універсальних програмних засобів і аналітичних платформ для пошуку закономірностей, зв'язків, правил, знань в електронних масивах даних.

КОМПЕТЕНТНОСТІ

Інтегральна компетентність Здатність розв'язувати складні спеціалізовані задачі та практичні проблеми у галузі інженерії програмного забезпечення, що характеризується комплексністю та невизначеністю умов із застосування теорій та методів інформаційних технологій.

Спеціальні (фахові, предметні) компетентності

  • ФК-1. Здатність аналізувати об’єкт проєктування або функціонування та його предметну область.
  • ФК-11. Здатність до аналізу, синтезу і оптимізації інформаційних систем та технологій з використанням математичних та імітаційних моделей і методів
  • ФК-13. Здатність проводити обчислювальні експерименти, порівнювати результати експериментальних даних і отриманих рішень.
  • ФК-18. Здатність до розробки і використання інтелектуальних інформаційних систем, технологій генерації та аналізу знань, алгоритмів штучного інтелекту для вирішення прикладних задач і підтримки прийняття рішень в різних прикладних областях життєдіяльності людини.
  • ФК-19. Здатність до застосування методів прийняття управлінських рішень в умовах невизначеності та багатофакторної залежності щодо визначення рішення та ефективності управлінської діяльності.
  • ФК-22. Здатність розробляти модулі обробки даних інформаційних управляючих технологій на основі математичних та імітаційних моделей.

ПРОГРАМНІ РЕЗУЛЬТАТИ НАВЧАННЯ

  • ПРН-6. Демонструвати знання сучасного рівня технологій інформаційних систем, практичні навички програмування та використання прикладних і спеціалізованих комп’ютерних систем та середовищ з метою їх запровадження у професійній діяльності.
  • ПРН-21. Знати спеціалізовані мови та технології програмування.
  • ПРН-24. Вміти розв’язувати складні непередбачувані задачі і проблеми у спеціалізованих сферах професійної діяльності та/або навчання, що передбачають збирання та інтерпретацію та аналіз інформації (даних), вибір методів та інструментальних засобів, застосування інноваційних підходів рішень.
  • ПРН-30. Вміти використовувати методи та засоби аналізу даних при розв’язанні прикладних проблем у спеціалізованих сферах професійної діяльності, в тому числі і з використанням відповідного програмного.
  1. Пререквізити та постреквізити дисципліни (місце в структурно-логічній схемі навчання за відповідною освітньою програмою)

Пререквізити:

  • Вища математика,
  • Дискретна математика,
  • Теорія ймовірності, ймовірнісні процеси та математичної статистики,
  • Додаткові розділи теорії ймовірностей, ймовірнісних процесів та математичної статистики.

Постреквізити:

  • Дослідження операцій.
  • Системи штучного інтелекту.

Зміст навчальної дисципліни

Тема 1. Що таке DATA MINING?
Тема 2. Методи і стадії DATA MINING
Тема 3. Завдання DATA MINING
Тема 4. Завдання DATA MINING. Класифікація та кластеризація
Тема 5. Завдання DATA MINING. Прогнозування та візуалізація.
Тема 6 .** Основи аналізу даних
Тема 7. Методи класифікації і прогнозування. Дерева рішень
Тема 8. Методи класифікації і прогнозування. Метод опорних векторів. Метод "Найближчого сусіда". Байєсова класифікація
Тема 9. Методи класифікації і прогнозування. Нейронні мережі
Тема 10. Нейронні мережі. Карти Кохонена.
Тема 11. Методи кластерного аналізу. Ієрархічні методи
Тема 12. Методи кластерного аналізу. Ітеративні методи.
Тема 13. Методи пошуку асоціативних правил
Тема 14. Інтелектуальний аналіз тексту
Тема 15. Плагіат
Тема 16. Аналіз тональності тексту
Тема 17. Принципи контен та інтент-аналізів
Тема 18. Рекамендаційні системи
Тема 19. Теорія розпізнавання образів
Тема 20. Аналіз даних в соціальних мережах
Тема 21. Класифікація задач та методів прийняття рішень.
Тема 22. Загальна постановка однокритеріальної задачі прийняття рішень
Тема 23. Багатокритеріальні задачі прийняття рішень.
Тема 24. Прийняття рішень в умовах невизначеності
Тема 25. Теорія ігор. Класифікація ігор.
Тема 26. Матричні ігри.
Тема 27. Нескінченні антагоністичні ігри
Тема 28 Безкоаліційні ігри
  1. Навчальні матеріали та ресурси

Базова

1.and Uthurusamy, Fayyad, Piatetsky-Shapiro, Smyth Advances in Knowledge Discovery and Data Mining, , (Chapter 1). AAAI/MIT Press 1996

\2. Вячеслав Дюк Data mining - интеллектуальный анализ данных

\3. Parsaye K A. Characterization of Data Mining Technologies and Processes. The Journal of Data Warehousing. 1998.№ 1

\4. Дадим слово критикам По материалам зарубежных сайтов, перевод Intersoft Lab, 2003 г

\5. Gregory Piatetsky-Shapiro Machine Learning and Data Mining. Course Notes. Fall 2003

\6. Иванов О.В Статистика / Учебный курс для социологов и менеджеров. Часть 1. Описательная статистика. Теоретико-вероятностные основания статистического вывода. М. 2005. 187 с

\7. CSci 5980: Data Mining (Spring 2004). Vipin Kumar. Army High Performance Computing Research Center, Department of Computer Science, University of Minnesota

\8. Newquist H. P Data Mining: The AI Metamorphosis. Database Programming and Design. - 1996. № 9

\9. Parsaye K A Characterization of Data Mining Technologies and Processes. The Journal of Data Warehousing. 1998.№ 1

\10. Brand E., Gerritsen R. Data Mining and Knowledge Discovery DBMS. 1998. № 7

\11. Л. В. Щавелёв Способы аналитической обработки данных для поддержки принятия решений СУБД. 1998. № 4-5

\12. Арагон Л Долой грязь! PC Week/RE. 1998. № 6. C. 53-54

\13. Киселев М., Соломатин Е Средства добычи знаний в бизнесе и финансахОткрытые системы. 1997. № 4. С. 41-44

\14. Мусаев А.А Алгоритмы аналитического управления производственными процессами Автоматизация в промышленности. 2004, №1, с. 30-35

\15. John F. Elder IV & Dean W. AbbottKDD-98: A Comparison of Leading Data Mining Tools Fourth International Conference on Knowledge Discovery & Data Mining, August 28, 1998. New York

\16. Дюк В.А., Самойленко А.П Data Mining: учебный курс СПб.: Питер, 2001

\17. Damiaan Zwietering, Helena Gottschalk, Hosung Kim, Joerg Reinschmidt Intelligent Miner for Data: Enhance Your Business Intelligence J June 1999, International Technical Support Organization, SG 245422

\18. Эделстейн Г Интеллектуальные средства анализа, интерпретации и представления данных в информационных хранилищах ComputerWeek-Москва. 1996. № 16. С. 32-33

\19. Николаев А Строителям информационных пирамид Открытые системы, 1999, №9-10

\20. Игорь Ашманов Информация и знания: невидимая грань

21.COMP 290-090 Data Mining: Concepts, Algorithms, and Applications Wei Wang Fall 2004, The UNIVERSITY of NORTH CAROLINA at CHAPEL HILL

\22. Gregory Piatetsky-Shapiro Machine Learning, Data Mining, and Knowledge Discovery: An Introduction

\23. Jiawei Han and Micheline Kamber Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor Morgan Kaufmann Publishers, August 2000. 550 pages. ISBN 1-55860-489-8

\24. Прогнозирование продаж товаров. Forecast Expert Sales System

\25. Можно ли увидеть 88-е измерение? Computerworld, 2002, №46.

\26. Аджиев В Mineset - визуальный инструмент аналитика Открытые системы, 1997, N3, с. 72-77

\27. Ananth Y. Grama, Naren Ramakrishnan Data Mining-Guest Editors' Introduction: From Serendipity to Science,

Computer, vol. 32, no. 8, pp. 34-37, August, 1999

\28. Data Mining. Применение

\29. Электронная коммерция. Data Mining

\30. Data Mining в сфере бизнеса и финансов: Фондовые рынки

31.Ahsan habib, Amalendu Roy, Baojing Lu, David Diaz, Jingkai Zhou, Maria Canton, Md Abdul Maleq Khan, Qin Ding, Qinghua Zou, Qun Wei Data Mining Survey 2000

\32. Беднарц Энн Новое слово в аналитике Computerworld, 2005, №16

\33. Венкатеш Ганти, Йоханнес Герке, Раджу Рамакришнан Добыча данных в сверхбольших базах данных Открытые системы, 1999, №9-10

34.Дюк В.А., Эмануэль В.Л Информационные технологии в медико-биологических исследованиях Питер, 2003, 525 с

\35. Деревья решений - общие принципы работы - BaseGroup Labs

\36. and M. Mehta, J. Shafer, R. Agrawal SPRINT: A Scalable Parallel Classifier for Data Mining, Proc. 22nd Int'l Conf. Very Large Data Bases," Morgan Kaufmann, San Francisco, 1996, pp. 544-555

\37. Метод Опорных Векторов

\38. B. Scholkopf, G. Ratsch, K. Muller, K. Tsuda, S. Mika An Introduction to Kernel-Based Learning Algorithms

IEEE Neural Networks, 12(2):181-201, May 2001

\39. Сайт STATISTICA (StatSoft)

\40. Chickering D, Geiger D., Heckerman D. Learning Bayesian networks: The combination of knowledge and statistical data Machine Learning. 1995. 20. P. 197-243

\41. Heckerman D Bayesian Networks for Data Mining Data Mining and Knowledge Discovery. 1997. № 1. P. 79-119

\42. etc, Friedman N., Geiger D., Goldszmidt M. Bayesian Network ClassifiersMachine Learning. 1997. 29. P. 131-165

\43. Brand E., Gerritsen R Naive-Bayes and Nearest Neighbor DBMS. 1998. № 7

\44. Итоги науки и техники: физические и математические модели нейронных сетей, том 1 М., изд. ВИНИТИ, 1990

\45. А.Н. Горбань, А.Н. Кирдин и др, В.Л. Дунин-Барковский Нейроинформатика Новосибирск: Наука, 1998. 296с

\46. А.Н. Горбань Методы нейроинформатики КГТУ, Красноярск, 1998. 205 с

\47. Rosendlatt F Principles of Neurodinamics Washington D.C.: Spartan Press, 1961

\48. Аналитическая платформа Deductor 4. Руководство пользователя BaseGroup Labs 1998-2005

\49. Медведев В.С., Потемкин В.Г Нейронные сети. Matlab 6 Диалог-МИФИ. 2002, 496 стр

\50. П.Маслобоев Введение в Neural Network Toolbox

\51. Уоссермен Нейрокомпьютерная техника М.,Мир, 1992

\52. and A. Zhang, G. Sheikholeslami, S. Chatterjee WaveCluster: A Multi-Resolution Clustering Approach for Very Large Spatial Databases Proc. 24th Int'l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1998, pp. 428-439

53.and K. Shim, R. Rastogi, S. Guha CURE: An Efficient Clustering Algorithm for Large Databases Proc. ACM SIGMOD Int'l Conf. Management of Data, ACM Press, New York, 1998, pp. 73-84

\54. M. Ester et al. A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise Proc. 2nd Int'l Conf. Knowledge Discovery Databases and Data Mining, AAAI Press, Menlo Park, Calif., 1996, pp. 226-231

\55. Информационные технологии и программирование: Межвузовский сборник статей. Вып. 2 (7) М.: МГИУ, 2003. 62 с

\56. И.С.Енюков Факторный, дискриминантный и кластерный анализ М.: Финансы и статистика, 1989

\57. А.Г. Костерин ПРАКТИКА СЕГМЕНТИРОВАНИЯ РЫНКА

\58. Swami, R. Agrawal, T. Imielinski Mining Associations between Sets of Items in Massive Databases Proc. of the ACM-SIGMOD 1993 Int'l Conference on Management of Data, Washington D.C., May 1993

\59. R. Agrawal, R. Srikant Fast Algorithms for Mining Association RulesProc. of the 20th Int'l Conference on Very Large Databases, Santiago, Chile, Sept. 1994

\60. Jong Soo Park, Ming-Syan Chen and Philip S. Yu An effective Hash-Based Algorithm for Mining Association Rules

Proc. of the ACM SIGMOD Int'l Conf. on Management of Data, San Jose, CA, 1995

\61. J. S. Park, M. S. Chen and P. S. Yu Efficient Hash-Based Algorithm for Mining Association Rules Proc. Int'l Conf. Information and Knowledge Management, Baltomore, Md., Nov. 1995

\62. Savasere, and S. Navathe, E. Omiecinski An Efficient Algorithm for Mining Association Rules in Large Databases Proc. 21st Int'l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1995, pp. 432-444

\63. S. Brin et al Dynamic Itemset Counting and Implication Rules for Market Basket Data

Proc. ACM SIGMOD Int'l Conf. Management of Data, ACM Press, New York, 1997, pp. 255-264

\64. У. Боумен Графическое представление информацииМ.: "Мир", 1971

\65. Chernoff, H The Use of Faces to Represent Points in K-Dimensional Space Graphically Journal of American Statistical Association, 68, 361-368

\66. Edward. R. Tufte The Visual Display of Quantitative Information Graphics Press. 2001

\67. Филип РассомТенденции программного обеспечения в области визуализации данных для бизнес-пользователей 01.05.2000

\68. Плотинский Ю.М Визуализация информации М., 1994

\69. Ю.Н Книга, Ю.Р. Валькман Графическое представление информации в проблемах принятия решений

Материалы Диалога 2001

\70. Eom S.B decosion support systems research: reference disciplines and a cumulative tradition The International Journal of Management Science, 23, 5, October 1995, p. 511-523

\71. Hackthorn R, Inmon W.H. Using the Data Warehouse 1994

\72. Fayyad U., Piatetsky-Shapiro G., Smyth P., Uthurusamy R Advances in Knowledge Discovery and Data Mining

AAAI/MIT Press: 1996

\73. Ginzberg M.S., Stohr E.A Decision Support Systems: Issues and Perspectives

\74. Ситник В.Ф та iн. Системи пiдтримки прийняття рiшень

К.: Технiка, 1995

\75. Simon H.A The New Science of Management Decision

\76. Венкатеш Ганти, Сураджит Чаудхури, Умешвар Дайал Технология баз данных в системах поддержки принятия решений Открытые системы, 2002, №1

\77. Львов В Создание систем поддержки принятия решений на основе хранилищ данных Системы управления базами данных, 1997, №3

\78. Parsaye K Surveying Decision Support: New Realms of Analysis Database Programming and Design. 1996. № 4

\79. Э.А. Тахтенгерц Компьютерная поддержка принятия решений М.: СИНТЕГ. 1998, с. 376, с ил

\80. Совместное использование учетных систем и технологии OLAP 2003 г

\81. Интеграция OLAP и ИАД

\82. Parsaye K OLAP and Data Mining: Bridging the Gap Database Programming and Design. 1997. № 2

\83. Билл Инмон Производительность систем хранилищ данных

Performance In The Data Warehouse Environment. 2000 г. №4. С. 41-48

\84. Кузнецов С Хранилища данных в начале века Открытые системы, 2002, №1

\85. D. Hackathorn Reinventing Enterprise Systems Via Data Warehousing Washington, DC: The Data Warehousing Institute Annual Conference, 1995

\86. Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелев Л. В Решение проблемы комплексного оперативного анализа информации хранилищ данных Системы управления базами данных, 1997, №5-6

\87. Полина Трофимова Если хранилища данных создаются, значит, это кому-нибудь нужно? Intelligent Enterprise, 29 мая, 2001 г

\88. ГЛОССАРИЙ ПО DWH, OLAP, XML

\89. Десять основных тенденций 2005 года в области Business Intelligence и Хранилищ данных: оправдался ли прогноз? КЛУБ ЗНАТОКОВ DATAWAREHOUSE, OLAP, XML.

\90. Вон Ким Три основных недостатка современных хранилищ данных Открытые системы, 2003, №2

\91. Choi, D. Lee, E. Hong, S. Kim, W. Kim A Taxonomy of Dirty Data Journal of Data Mining and Knowledge Discovery, the Kluwer Academic-Publishers, 2003

\92. Erhard Ram, Hong Hai Do Очистка данных: проблемы и актуальные подходы 01.12.2000

\93. Джули Борт Очистка данных Computerworld, 1996, №34

\94. Рич Олшефски Как избежать двух основных крайностей программ по очистке данных

\95. Роналд Фоурино Электронное качество данных: скрытая перспектива очистки данных 01.03.2001

\96. Бакалавр Экономики : хрестоматия. В 3 т. Т.2 / РЭА им. Г.В. Плеханова Центр кадрового развития. М. : Инф.-издат. фирма "Триада", 1999. - 1056 с

\97. Вейн Куртц, Джим Янг, Санай Сони, Чжаохай Танг Измерение быстродействия работы алгоритмов 10.09.2002

\98. Виртуальное проектирование изделий (VPD) в мировой практике информационной поддержки жизненного цикла продукции 2005 г

\99. Сайт CRISP-DM

\100. Colin Shearer (SPSS) and Rudiger Wirth (DaimlerChrysler), Julian Clinton (SPSS), Pete Chapman (NCR), Randy Kerber (NCR), Thomas Khabaza (SPSS), Thomas Reinartz (DaimlerChrysler) CRISP-DM 1.0. Step-by-step data mining guide Copyright c 1999, 2000

\101. Сайт компании SAS

\102. DMG

\103. SAS Enterprise Miner 5.1 - 2003 by SAS Institute Inc.

\104. Сайт компании Мегапьютер

\105. Арсеньев С, Слынько Ю. Универсальная платформа интеллектуального бизнеса Открытые системы, 2001, №10

\106. Сайт компании Cognos

\107. Материалы предоставлены компанией Микротест - Программ Лайн

\108. Сайт компании StatSoft

\109. Сайт www.spc-consulting.ru/dms/

\110. STATISTICA System Reference - 2003 by StatSoft Inc.

\111. Сайт компании Oracle

\112. Продукты Oracle

\113. Ольга Горчинская Семинары по технологиям Oracle9i. Инструментальные средства Oracle Data Mining

\114. Сайт компании BaseGroup Labs

\115. Сайт компании KXEN

\116. Материалы предоставлены компанией КХЕМА

\117. Материалы предоставлены компанией SnowCactus

Інформаційні ресурси

Для викладання дисципліни необхідні наступні ресурси:

- В лекційній аудиторії має бути комп’ютер з доступом до Moodle, а також проектор;

- В аудиторії, де проводяться лабораторні роботи, мають бути робочі станції з доступом до Інтернету і браузерами, в кількості студентів у групі, для проходження підсумкового тестів. Maє бути забезпечений доступ студентів до Moodle та Google classroom.

- Програмне забезпечення: бібліотеки R та Python, https://bigml.com/, https://www.philippe-fournier-viger.com/spmf/, які розповсюджуються по безкоштовній ліцензії.

Навчальний контент

  1. Методика опанування навчальної дисципліни (освітнього компонента)

Кредитів - 4,5,

Годин – 135:

Аудиторних годин – 54:

Лекції – 36,

Лабораторні роботі – 18,

Самостійна робота – 81.

ЯКИХ ПЕРЕДБАЧАЄ НАВЧАЛЬНА ДИСЦИПЛІНА

\1. Опорний конспект лекцій

\2. Навчальні посібники

\3. Силабус

\4. Програмне забезпечення: бібліотеки R та Python, https://bigml.com/, https://www.philippe-fournier-viger.com/spmf/.

\5. Комплект завдань для поточного оцінювання навчальних досягнень,

\6. Засоби підсумкового контролю (комплект завдань для підсумкового контролю).

МЕТОДИ НАВЧАННЯ:

Лекційні заняття проходять з використанням мультимедійних технологій та наступних методів:

- Пояснювально-ілюстративного методу Послідовна та логічно ув’язана подача матеріалу надає уявлення та знання у його логічної цілісності

- Метод проблемного викладу надає уяву та методи отримання нових знань та фактів з використанням вже відомих фактів та тверджень

- Інтерактивний метод під час лекційних занять використовується для встановлення діалогу з аудиторією.

Лабораторні заняття проходять з використанням

\1) репродуктивного методу, завдяки якому студенти закріплюють вивчений теоретичний матеріал та навчаються використовувати його в конкретних задачах

\2) проблемного методу, при застосуванні якого студенти залучаються до обговорення та вирішення задач, пов’язаних з новітніми інформаційними технологіями аналітичної обробки інформації

Самостійна робота з можливістю особистих консультацій з викладачем

Лекційні заняття

|**Лекція 1.Тема 1. Що таке DATA MINING?|1| | :- | :- | |Тема 2. Методи і стадії DATA MINING|1| |Лекція 2. Тема 3. Завдання DATA MINING|1| |Тема 4. Завдання DATA MINING. Класифікація та кластеризація|1| |Лекція 3. Тема 5. Завдання DATA MINING. Прогнозування та візуалізація.|1| |Тема 6 . Основи аналізу даних|1| |Лекція 4. Тема 7. Методи класифікації і прогнозування. Дерева рішень|1| |Тема 8. Методи класифікації і прогнозування. Метод опорних векторів. Метод "Найближчого сусіда". Байєсова класифікація|1| |Лекція 5. Тема 9. Методи класифікації і прогнозування. Нейронні мережі|1| |Тема 10. Нейронні мережі. Самоорганізуються карти Кохонена.|1| |Лекція 6. Тема 11. Методи кластерного аналізу. Ієрархічні методи|1| |Тема 12. Методи кластерного аналізу. Ітеративні методи.|1| |Лекції 7-8. Тема 13. Методи пошуку асоціативних правил|4| |Лекція 9. Тема 14. Інтелектуальний аналіз тексту|2| |Лекція 10. Тема 15. Плагіат|2| |Лекція 11. Тема 16. Аналіз тональності тексту|1| |Тема 17. Принципи контен та інтент-аналізів|1| |Лекція 12. Тема 18. Рекамендаційні системи|2| |Лекція 13. Тема 19. Теорія розпізнавання образів|2| |Лекція 14. Тема 20. Аналіз даних в соціальних мережах|2| |Лекція 15. Тема 21. Класифікація задач та методів прийняття рішень.|1| |Тема 22. Загальна постановка однокритеріальної задачі прийняття рішень|0,5| |Тема 23. Багатокритеріальні задачі прийняття рішень.|0,5| |Лекція 16. Тема 24. Прийняття рішень в умовах невизначеності|2| |Лекція 17. Тема 25. Теорія ігор. Класифікація ігор. |1| |Тема 26. Матричні ігри.|1| |Лекція 18. Тема 27. Нескінченні антагоністичні ігри|1| |Тема 28 Безкоаліційні ігри|1| |ВСЬОГО|36 | Календарне планування лекційних занять

|Номер лекції|Дата проведення| | :-: | :-: | |Лекція 1|| |Лекція 2|| |Лекція 3|| |Лекція 4|| |Лекція 5|| |Лекція 6|| |Лекція 7|| |Лекція 8|| |Лекція 9|| |Лекція 10|| |Лекція 11|| |Лекція 12|| |Лекція 13|| |Лекція 14|| |Лекція 15|| |Лекція 16|| |Лекція 17|| |Лекція 18|| Лабораторні заняття

Тематично-календарний план проведення лабораторних занять

|№|Лабораторна робота|Тема|Години|Дата| | - | - | - | - | - | |1|Лабораторна робота 1|Методи обробки експериментальних даних|2|| |2|Лабораторна робота 2|Стохастичні методи пошуку|2|| |3|Лабораторна робота 3|Дерева вирішальних правил|2|| |4|Лабораторна робота 4|

Методи видобування асоціативних правил

з великих масивів даних

|2|| |5|Лабораторна робота 5|Ієрархічні методи кластерного аналізу|2|| |6|Лабораторна робота 6|Неієрархічні методи кластерного аналізу|2|| |7|Лабораторна робота 7|Нейро-нечіткі системи|2|| |8|Підсумкове заняття|Здача та захист лабораторних робіт|2|| |9|Тест|Підсумковий|2|| Всього на лабораторні заняття виділено 18 годин.

  1. Самостійна робота студента/аспіранта

Самостійна робота студентів складається з:

Самостійна робота

Тема 1. Що таке DATA MINING? 2
Тема 2. Методи і стадії DATA MINING 2
Тема 3. Завдання DATA MINING 2
Тема 4. Завдання DATA MINING. Класифікація та кластеризація 2
Тема 5. Завдання DATA MINING. Прогнозування та візуалізація. 2
Тема 6 .** Основи аналізу даних 3
Тема 7. Методи класифікації і прогнозування. Дерева рішень 3
Тема 8. Методи класифікації і прогнозування. Метод опорних векторів. Метод "Найближчого сусіда". Байєсова класифікація 3
Тема 9. Методи класифікації і прогнозування. Нейронні мережі 3
Тема 10. Нейронні мережі. Самоорганізуються карти Кохонена. 4
Тема 11. Методи кластерного аналізу. Ієрархічні методи 3
Тема 12. Методи кластерного аналізу. Ітеративні методи. 3
Тема 13. Методи пошуку асоціативних правил 3
Тема 14. Інтелектуальний аналіз тексту 3
Тема 15. Плагіат 3
Тема 16. Аналіз тональності тексту 3
Тема 17. Принципи контен та інтент-аналізів 3
Тема 18. Рекомендаційні системи 3
Тема 19. Теорія розпізнавання образів 4
Тема 20. Аналіз даних в соціальних мережах 3
Тема 21. Класифікація задач та методів прийняття рішень. 3
Тема 22. Загальна постановка однокритеріальної задачі прийняття рішень 3
Тема 23. Багатокритеріальні задачі прийняття рішень. 3
Тема 24. Прийняття рішень в умовах невизначеності 3
Тема 25. Теорія ігор. Класифікація ігор. 3
Тема 26. Матричні ігри. 3
Тема 27. Нескінченні антагоністичні ігри 3
Тема 28 Безкоаліційні ігри 3
ВСЬОГО 81

Політика та контроль

  1. Політика навчальної дисципліни (освітнього компонента)

Форми організації освітнього процесу, види навчальних занять і оцінювання результатів навчання регламентуються Положенням про організацію освітнього процесу в Національному технічному університеті України «Київському політехнічному інституті імені Ігоря Сікорського».

Політика виставлення оцінок: кожна оцінка виставляється відповідно до розроблених викладачем та заздалегідь оголошених студентам критеріїв, а також мотивується в індивідуальному порядку на вимогу студента; у випадку не виконання студентом усіх передбачених навчальним планом видів занять (лабораторних робіт, тесту) до екзамену він не допускається; пропущені заняття обов’язково мають бути відпрацьовані.

**Відвідування є обов'язковим (**за винятком випадків, коли існує поважна причина, наприклад, хвороба чи дозвіл працівників деканату). Якщо студент не може бути присутніми на заняттях, він все одно несете відповідальність за виконання завдань, що проводились в комп’ютерному класі.

Порядок зарахування пропущених занять. Відпрацювання пропущеного заняття з лекційного курсу здійснюється шляхом підготовки і захисту реферату за відповідною темою у вигляді презентації. Захист реферату відбувається відповідно до графіку консультацій викладача, з яким можна ознайомитись на кафедрі. Відпрацювання пропущеного лабораторного заняття здійснюється шляхом самостійного виконання завдання і його захисту відповідно до графіку консультацій викладача.

Реферати також можуть підготувати студенти, у яких недостатньо рейтингових балів.

Політика академічної поведінки та доброчесності: конфліктні ситуації мають відкрито обговорюватись в академічних групах з викладачем, необхідно бути взаємно толерантним, поважати думку іншого. Плагіат та інші форми нечесної роботи неприпустимі. Всі індивідуальні завдання та курсову роботу студент має виконати самостійно із використанням рекомендованої літератури й отриманих знань та навичок. Цитування в письмових роботах допускається тільки із відповідним посиланням на авторський текст. Недопустимі підказки і списування у ході захисту лабораторних робіт, на контрольних роботах, на іспиті.

Норми академічної етики: дисциплінованість; дотримання субординації; чесність; відповідальність; робота в аудиторії з відключеними мобільними телефонами. Повага один до одного дає можливість ефективніше досягати поставлених командних результатів. При виконанні лабораторних робіт студент може користуватися ноутбуками. Проте під час лекційних занять та обговорення завдань лабораторних робіт не слід використовувати ноутбуки, смартфони, планшети чи комп’ютери. Це відволікає викладача і студентів групи та перешкоджає навчальному процесу. Якщо ви використовуєте свій ноутбук чи телефон для аудіо- чи відеозапису, необхідно заздалегідь отримати дозвіл викладача.

Дотримання академічної доброчесності студентів й викладачів регламентується кодекс честі Національного технічного університету України «Київський політехнічний інститут», положення про організацію освітнього процесу в КПІ ім. Ігоря Сікорського

  1. Види контролю та рейтингова система оцінювання результатів навчання (РСО)

РОЗПОДІЛ БАЛІВ, ЯКІ ОТРИМУЮТЬ СТУДЕНТИ НА ЛАБОРАТОРНИХ ЗАНЯТТЯХ

|Види контролю|бали| | - | - | |Лабораторні роботи (7 робіт)|10| |Тест|30| R=(7*10+30)*0,6=60

Календарний контроль: провадиться двічі на семестр як моніторинг поточного стану виконання вимог силабусу.

За результатами навчальної роботи за перші 7 тижнів максимально можлива кількість балів – 28 балів. На першій атестації (8-й та 9-й тиждень) студент отримує “зараховано”, якщо його поточний рейтинг не меше 20 балів.

За результатами 13 тижнів навчання максимально можлива кількість балів – 62 балів. На другій атестації (14-й тиждень) студент отримує “зараховано”, якщо його поточний рейтинг не менше 50 балів.

Семестровий контроль: екзамен

Умови допуску до семестрового контролю: мінімально позитивна оцінка за індивідуальне завдання / зарахування усіх лабораторних робіт та тест/ семестровий рейтинг більше 40 балів.

На екзамені студент може отримати максимум 40 балів.

  • повна відповідь - 40;
  • часткова відповідь - 1…39;
  • незадовільна відповідь - 0.

Таблиця відповідності рейтингових балів оцінкам за університетською шкалою:

Кількість балів Оцінка
100-95 Відмінно
94-85 Дуже добре
84-75 Добре
74-65 Задовільно
64-60 Достатньо
Менше 60 Незадовільно
Не виконані умови допуску (менше 40 ) Не допущено

Додаткова інформація з дисципліни (освітнього компонента)

Теми рефератів для отримання додаткових балів:

\1. Інтелектуальні інформаційні системи.

\2. Історія теорії дейтамайнінгу та напрямки розвитку.

\3. Сфери застосування дейтамайнінгу в бізнесі та промисловості.

\4. Використання концепції web- та  text-mining.

\5. Класи процесів та основні види закономірностей дейтамайнінгу.

\6. Основні методи дейтамайнінгу.

\7. Метод побудови дерева рішень.

\8. Вилучення правил, як представник логічних методів дейтамайнінгу.

\9. Метод «найближчого сусіда».

\10. Метод CBR.

\11. Статистичні методи дейтамайнінгу.

\12. Методи візуалізації даних.

\13. Загальна  характеристика та приклади універсальних систем дейтамайнінгу.

\14. Огляд модулів дейтамайнінгу в статистичних пакетах.

\15. Універсальні програмні системи дейтамайнінгу.

\16. Загальна характеристика, архітектура, інструментарій та приклади використання компоненту Oracle9i Data Mining.

\17. Загальна характеристика, архітектура, інструментарій та приклади використання компоненту DB2 Intelligent Miner (компанії IBM).

\18. Загальна характеристика, архітектура, інструментарій та приклади використання служби Analysis Services в Microsoft SQL Server 2000.

\19. Загальна характеристика, архітектура, інструментарій та приклади використання пакету Knowledge Studio (компанії Angoss Software).

\20.  Загальна характеристика, архітектура, інструментарій та приклади використання пакету SAS Enterprise Miner.

\21. Загальна характеристика, архітектура, інструментарій та приклади використання пакету Clementine (Integral Solutions).

\22. Загальна характеристика, пакету Polyanalyst (компанії Megaputer Intelligence).

\23. Опис архітектури та інструментарію пакету Polyanalyst (компанії Megaputer Intelligence).

\24. Приклади використання пакету Polyanalyst (компанії Megaputer Intelligence).

\25. Загальна характеристика, архітектура, інструментарій та приклади використання пакету See5.

\26. Загальна характеристика, архітектура, інструментарій та приклади використання  пакету WizWhy.

\27. Загальна характеристика, архітектура, інструментарій та приклади використання систем, які використовують метод CBR.

\28. Загальна характеристика, архітектура, інструментарій та приклади використання пакету MineSet для візуального дейтамайнінгу (компанії Silicon Graphics).

\29. Штучні нейронні мережі в інформаційних системах та їх історія.

\30. Сфери використання штучних нейромереж.

\31. Теоретичне підгруття штучних нейромереж.

\32. Класифікація нейромереж.

\33. Загальна характеристика, архітектура, інструментарій та приклади використання пакетів готового програмного забезпечення нейронних мереж.

\34. Ідейна основа генетичних алгоритмів.

\35. Теоретичне підгруття генетичних алгоритмів як спосіб вирішення задач оптимізації. Їх переваги та недоліки.

\36. Загальна характеристика, архітектура, інструментарій та приклади використання готового програмного забезпечення генетичних алгоритмів.

\37. Сфери застосування генетичних алгоритмів в бізнесі та промисловості.

\38. Програмні агенти: визначення, типи та харакетристики програмних агентів.

\39. Теоретичне пігрунття нечіткої логіки.

\40. Нечіткий логічний висновок та його використання в економічних інформаційних системах.

\41. Загальна характеристика, архітектура, інструментарій та приклади використання готового програмного забезпечення нечіткої логіки в народному господарстві.

\42. Дейтамайнінг в торгівлі та маркетингу (аналіз купівельного кошика).

\43. Дейтамайнінг в торгівлі та маркетингу (дослідження часових шаблонів продаж).

\44. Дейтамайнінг в торгівлі та маркетингу (генерування прогностичних моделей покупців).

\45. Дейтамайнінг в банківській справі (виявлення шахрайства з кредитними картакми).

\46. Дейтамайнінг в банківській справі (сегментація клієнтів).

\47. Дейтамайнінг в банківській справі (прогнозування змін клєнтури).

\48. Дейтамайнінг в телекомунікаціях (аналіз про докладні характеристики викликів).

\49. Дейтамайнінг в телекомунікаціях (виявлення лояльності клієнтів).

\50. Дейтамайнінг в страховій справі (виявлення шахрайств).

\51. Дейтамайнінг в страховій справі (аналіз ризику).

\52. Дейтамайнінг в ріелторській справі (оцінка нерухомості).

\53. Дейтамайнінг в логістиці (пошук оптимального логістичного ланцюжка).

\54. Дейтамайнінг в електронній комерції  (для побудови рекомендаційних систем інтернет-магазинів).

\55. Дейтамайнінг в електронній комерції  (для вирішення проблеми персоналізації відвідувачів).

\56. Дейтамайнінг в происловості (прогнозування якості виробів в залежності від вимірюваних параметрів технологічного процесу).

\57. Карта Кохенена.

\58. Support Vector Machines.

\59. Алгоритм покриття.

\60. Алгоритм С4.5.

\61. Алгоритм Apriori.

Робочу програму навчальної дисципліни (силабус):

Складено доцент, к.ф.-м.н., доцент, Гавриленко О.В.

Ухвалено кафедрою ІСТ(протокол № 1 від 30.08.2021 р.)

Погоджено Методичною комісією факультету[1] (протокол № 1 від 30.08.2021 р.)