Аналіз даних в інформаційно-управляючих системах - Робоча програма навчальної дисципліни (Силабус)

Реквізити навчальної дисципліни

Рівень вищої освіти Перший (бакалаврський)
Галузь знань Інформаційні технології
Спеціальність 126 Інформаційні системи та технології
Освітня програма Інформаційні управляючі системи та технології
Статус дисципліни Вибіркова
Форма навчання очна/заочна
Рік підготовки, семестр 2 курс, весняний семестр
Обсяг дисципліни 4 кредита
Семестровий контроль/ контрольні заходи Залік
Розклад занять

Другий семестр

http://rozklad.kpi.ua/Schedules/ViewSchedule.aspx?v=c6746e2a-d8f8-4f9f-bb1d-9b0912b188ef

Мова викладання Українська
Інформація про
керівника курсу / викладачів

Лектор: к.ф.-м.н., доц., доц. кафедри ІСТ Гавриленко О.В., gelena1980@gmail.com

Лабораторні заняття: к.ф.-м.н., доц., доц. кафедри ІСТ Гавриленко О.В., gelena1980@gmail.com

Розміщення курсу

https://classroom.google.com/u/0/c/MTQ1MTY0NjUzNDk1,

https://do.ipo.kpi.ua/course/view.php?id=5470

Програма навчальної дисципліни

Опис навчальної дисципліни, її мета, предмет вивчання та результати навчання

Мета вивчення дисципліни – набуття ключових фахових компетентностей, теоретичних знань і практичних навичок з інтелектуального аналізу даних у різних сферах професійної діяльності.

Предметом вивчення дисципліни є технології, методи та засоби інтелектуального аналізу даних.

Завдання вивчення дисципліни: – оволодіння основними поняттями інтелектуального аналізу даних; – ознайомлення з новітніми інформаційними технологіями аналітичної обробки інформації; – набуття практичних навичок використання методів і засобів інтелектуального аналізу даних.

Навчальна дисципліна покликана допомогти студенту отримати:

  • знання основних понять, методів, засобів, моделей та алгоритмів інтелектуального аналізу даних;

  • розуміння принципів застосування технологій інтелектуального аналізу даних;

  • уміння вільно орієнтуватися на сучасному ринку аналітичних програмних продуктів; практично застосовувати методи консолідації, трансформації, візуалізації, оцінки якості, очищення та предобробки даних для якісної підготовки даних до аналізу; використовувати програмне забезпечення для використання процедур інтелектуального аналізу при обробці інформації;

  • здатність використовувати можливості вітчизняних і зарубіжних універсальних програмних засобів і аналітичних платформ для пошуку закономірностей, зв'язків, правил, знань в електронних масивах даних.

КОМПЕТЕНТНОСТІ

Інтегральна компетентність Здатність розв'язувати складні спеціалізовані задачі та практичні проблеми у галузі інженерії програмного забезпечення, що характеризується комплексністю та невизначеністю умов із застосування теорій та методів інформаційних технологій.

Спеціальні (фахові, предметні) компетентності

  • ФК-1. Здатність аналізувати об’єкт проєктування або функціонування та його предметну область.

  • ФК-11. Здатність до аналізу, синтезу і оптимізації інформаційних систем та технологій з використанням математичних та імітаційних моделей і методів

  • ФК-13. Здатність проводити обчислювальні експерименти, порівнювати результати експериментальних даних і отриманих рішень.

  • ФК-18. Здатність до розробки і використання інтелектуальних інформаційних систем, технологій генерації та аналізу знань, алгоритмів штучного інтелекту для вирішення прикладних задач і підтримки прийняття рішень в різних прикладних областях життєдіяльності людини.

  • ФК-19. Здатність до застосування методів прийняття управлінських рішень в умовах невизначеності та багатофакторної залежності щодо визначення рішення та ефективності управлінської діяльності.

  • ФК-22. Здатність розробляти модулі обробки даних інформаційних управляючих технологій на основі математичних та імітаційних моделей.

ПРОГРАМНІ РЕЗУЛЬТАТИ НАВЧАННЯ

  • ПРН-6. Демонструвати знання сучасного рівня технологій інформаційних систем, практичні навички програмування та використання прикладних і спеціалізованих комп’ютерних систем та середовищ з метою їх запровадження у професійній діяльності.

  • ПРН 18. Знати спеціалізовані мови та технології програмування необхідні для розробки програмного забезпечення інформаційних управляючих систем та технологій підтримки прийняття рішень. Розробляти відповідне програмне забезпечення, що входить до складу інформаційних управляючих систем та технологій підтримки прийняття рішень.

  • ПРН 19. Вміти розв’язувати складні непередбачувані задачі і проблеми у спеціалізованих сферах професійної діяльності та/або навчання, що передбачають збирання та інтерпретацію та аналіз інформації (даних), вибір методів та інструментальних засобів, застосування інноваційних підходів

  • ПРН-21. Вміти використовувати методи та засоби аналізу даних, обирати та використовувати математичні моделі, будувати стратегії розв’язання практичних задач, в тому числі в галузі штучного інтелекту.

Пререквізити та постреквізити дисципліни (місце в структурно-логічній схемі навчання за відповідною освітньою програмою)

Пререквізити:

  • Вища математика,

  • Дискретна математика,

  • Теорія ймовірності, ймовірнісні процеси та математичної статистики,

  • Додаткові розділи теорії ймовірностей, ймовірнісних процесів та математичної статистики.

Постреквізити:

  • Дослідження операцій.

  • Системи штучного інтелекту.

Зміст навчальної дисципліни

1. ВСТУП ДО DATA MINING

1.1. ЩО ТАКЕ DATA MINING?

1.2. МЕТОДИ І СТАДІЇ DATA MINING

1.3. ЗАВДАННЯ DATA MINING

2. ЗАДАЧІ DATA MINING

2.1. ЗАВДАННЯ DATA MINING. КЛАСИФІКАЦІЯ ТА КЛАСТЕРИЗАЦІЯ

2.2. ЗАВДАННЯ DATA MINING. ПРОГНОЗУВАННЯ І ВІЗУАЛІЗАЦІЯ

2.3. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. ДЕРЕВА РІШЕНЬ

2.4. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. МЕТОД ОПОРНИХ ВЕКТОРІВ. МЕТОД "НАЙБЛИЖЧОГО СУСІДА". БАЙЄСОВА КЛАСИФІКАЦІЯ

2.5. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. НЕЙРОННІ МЕРЕЖІ

2.6. НЕЙРОННІ МЕРЕЖІ. САМООРГАНІЗУЮТЬСЯ КАРТИ КОХОНЕНА

2.7. МЕТОДИ КЛАСТЕРНОГО АНАЛІЗУ. ІЄРАРХІЧНІ МЕТОДИ

2.8. МЕТОДИ КЛАСТЕРНОГО АНАЛІЗУ. ІТЕРАТИВНІ МЕТОДИ

2.9. МЕТОДИ ПОШУКУ АСОЦІАТИВНИХ ПРАВИЛ

3. TEXT MINING

3.1. ІНТЕЛЕКТУАЛЬНИЙ АНАЛІЗ ТЕКСТУ

3.2. ПЛАГІАТ

3.3. АНАЛІЗ ТОНАЛЬНОСТІ ТЕКСТУ

4. УНІВЕРСАЛЬНІ ПРИНЦИПИ DATA MINING

4.1. ПРИНЦИПИ КОНТЕН ТА ІНТЕНТ-АНАЛІЗІВ

4.2. АНАЛІЗ ДАНИХ В СОЦІАЛЬНИХ МЕРЕЖАХ

5. ВИКОРИСТАННЯ DATA MINING В ТЕОРІЇ ПРИЙНЯТТЯ РІШЕНЬ

5.1. КЛАСИФІКАЦІЯ ЗАВДАНЬ ТА МЕТОДІВ ПРИЙНЯТТЯ РІШЕНЬ

5.2. КРИТЕРІЇ ПРИЙНЯТТЯ РІШЕНЬ. ТЕОРЕТИЧНИЙ МАТЕРІАЛ

5.3. МАТРИЧНІ ІГРИ

Навчальні матеріали та ресурси

Базова

1. Christopher Pal, Mark Hall, Eibe Frank, Ian Witten. Data Mining: Practical Machine Learning Tools and Techniques, 4rd ed. / Morgan Kaufmann, 2016.

2. Jennifer Reese, Richard Reese. Java for Data Science / Packt Publishing, 2017.

3. Bostjan Kaluza. Machine Learning in Java / Packt Publishing, 2016.

4. David Hand, Heikki Manilla, Padhraic Smyth. Principles of data mining / MIT Press, 2001.

5. Jason Bell. Machine Learning: Hands-On for Developers and Technical Professionals / John Wiley & Sons, 2014.

6. Michael Abernethy. Data mining with WEKA / IBM developerWorks, 2010.

7. Parsaye K A. Characterization of Data Mining Technologies and Processes. The Journal of Data Warehousing. 1998.№ 1

8. Newquist H. P Data Mining: The AI Metamorphosis. Database Programming and Design. - 1996. № 9

9. Parsaye K A Characterization of Data Mining Technologies and Processes. The Journal of Data Warehousing. 1998.№ 1

10. Brand E., Gerritsen R. Data Mining and Knowledge Discovery DBMS. 1998. № 7

11. John F. Elder IV & Dean W. AbbottKDD-98: A Comparison of Leading Data Mining Tools Fourth International Conference on Knowledge Discovery & Data Mining, August 28, 1998. New York

12. Damiaan Zwietering, Helena Gottschalk, Hosung Kim, Joerg Reinschmidt Intelligent Miner for Data: Enhance Your Business Intelligence J June 1999, International Technical Support Organization, SG 245422

13. Jiawei Han and Micheline Kamber Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor Morgan Kaufmann Publishers, August 2000. 550 pages. ISBN 1-55860-489-8

14. Ananth Y. Grama, Naren Ramakrishnan Data Mining-Guest Editors' Introduction: From Serendipity to Science,

Computer, vol. 32, no. 8, pp. 34-37, August, 1999

15. Ahsan habib, Amalendu Roy, Baojing Lu, David Diaz, Jingkai Zhou, Maria Canton, Md Abdul Maleq Khan, Qin Ding, Qinghua Zou, Qun Wei Data Mining Survey 2000

16. B. Scholkopf, G. Ratsch, K. Muller, K. Tsuda, S. Mika An Introduction to Kernel-Based Learning Algorithms

IEEE Neural Networks, 12(2):181-201, May 2001

17. Chickering D, Geiger D., Heckerman D. Learning Bayesian networks: The combination of knowledge and statistical data Machine Learning. 1995. 20. P. 197-243

18. Heckerman D Bayesian Networks for Data Mining Data Mining and Knowledge Discovery. 1997. № 1. P. 79-119

20. Swami, R. Agrawal, T. Imielinski Mining Associations between Sets of Items in Massive Databases Proc. of the ACM-SIGMOD 1993 Int'l Conference on Management of Data, Washington D.C., May 1993

21. R. Agrawal, R. Srikant Fast Algorithms for Mining Association RulesProc. of the 20th Int'l Conference on Very Large Databases, Santiago, Chile, Sept. 1994

22. Jong Soo Park, Ming-Syan Chen and Philip S. Yu An effective Hash-Based Algorithm for Mining Association Rules Proc. of the ACM SIGMOD Int'l Conf. on Management of Data, San Jose, CA, 1995

23. J. S. Park, M. S. Chen and P. S. Yu Efficient Hash-Based Algorithm for Mining Association Rules Proc. Int'l Conf. Information and Knowledge Management, Baltomore, Md., Nov. 1995

24. Savasere, and S. Navathe, E. Omiecinski An Efficient Algorithm for Mining Association Rules in Large Databases Proc. 21st Int'l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1995, pp. 432-444

25. S. Brin et al Dynamic Itemset Counting and Implication Rules for Market Basket Data Proc. ACM SIGMOD Int'l Conf. Management of Data, ACM Press, New York, 1997, pp. 255-264

26. Chernoff, H The Use of Faces to Represent Points in K-Dimensional Space Graphically Journal of American Statistical Association, 68, 361-368

27. Eom S.B decosion support systems research: reference disciplines and a cumulative tradition The International Journal of Management Science, 23, 5, October 1995, p. 511-523

28. Fayyad U., Piatetsky-Shapiro G., Smyth P., Uthurusamy R Advances in Knowledge Discovery and Data Mining

AAAI/MIT Press: 1996

29. Parsaye K OLAP and Data Mining: Bridging the Gap Database Programming and Design. 1997. № 2

Performance In The Data Warehouse Environment. 2000 г. №4. С. 41-48

30. D. Hackathorn Reinventing Enterprise Systems Via Data Warehousing Washington, DC: The Data Warehousing Institute Annual Conference, 1995

31. Choi, D. Lee, E. Hong, S. Kim, W. Kim A Taxonomy of Dirty Data Journal of Data Mining and Knowledge Discovery, the Kluwer Academic-Publishers, 2003

32. Colin Shearer (SPSS) and Rudiger Wirth (DaimlerChrysler), Julian Clinton (SPSS), Pete Chapman (NCR), Randy Kerber (NCR), Thomas Khabaza (SPSS), Thomas Reinartz (DaimlerChrysler) CRISP-DM 1.0. Step-by-step data mining guide Copyright c 1999, 2000

Інформаційні ресурси

Для викладання дисципліни необхідні наступні ресурси:

- В лекційній аудиторії має бути комп’ютер з доступом до Moodle, а також проектор;

- В аудиторії, де проводяться лабораторні роботи, мають бути робочі станції з доступом до Інтернету і браузерами, в кількості студентів у групі, для проходження підсумкового тестів. Maє бути забезпечений доступ студентів до Moodle та Google classroom.

- Програмне забезпечення: бібліотеки R та Python, https://bigml.com/, https://www.philippe-fournier-viger.com/spmf/, які розповсюджуються по безкоштовній ліцензії.

Навчальний контент

Методика опанування навчальної дисципліни (освітнього компонента)

Кредитів - 4,

Годин – 120:

Аудиторних годин – 72:

Лекції – 36,

Лабораторні роботі – 36,

Самостійна робота – 48.

ІНСТРУМЕНТИ, ОБЛАДНАННЯ ТА ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ, ВИКОРИСТАННЯ ЯКИХ ПЕРЕДБАЧАЄ НАВЧАЛЬНА ДИСЦИПЛІНА

1. Опорний конспект лекцій

2. Навчальні посібники

3. Силабус

4. Програмне забезпечення: бібліотеки R та Python, https://bigml.com/, https://www.philippe-fournier-viger.com/spmf/.

5. Комплект завдань для поточного оцінювання навчальних досягнень,

6. Засоби підсумкового контролю (комплект завдань для підсумкового контролю).

МЕТОДИ НАВЧАННЯ:

Лекційні заняття проходять з використанням мультимедійних технологій та наступних методів:

- Пояснювально-ілюстративного методу Послідовна та логічно ув’язана подача матеріалу надає уявлення та знання у його логічної цілісності

- Метод проблемного викладу надає уяву та методи отримання нових знань та фактів з використанням вже відомих фактів та тверджень

- Інтерактивний метод під час лекційних занять використовується для встановлення діалогу з аудиторією.

Лабораторні заняття проходять з використанням

1) репродуктивного методу, завдяки якому студенти закріплюють вивчений теоретичний матеріал та навчаються використовувати його в конкретних задачах

2) проблемного методу, при застосуванні якого студенти залучаються до обговорення та вирішення задач, пов’язаних з новітніми інформаційними технологіями аналітичної обробки інформації

Самостійна робота з можливістю особистих консультацій з викладачем

Лекційні заняття

ВСТУП ДО DATA MINING (6 год.)

Лекція 1. ЩО ТАКЕ DATA MINING? (2 год.)

Лекція 2. МЕТОДИ І СТАДІЇ DATA MINING (2 год.)

Лекція 3. ЗАВДАННЯ DATA MINING (2 год.)

ЗАДАЧІ DATA MINING (18 год.)

Лекція 4. ЗАВДАННЯ DATA MINING. КЛАСИФІКАЦІЯ ТА КЛАСТЕРИЗАЦІЯ (2 год.)

Лекція 5. ЗАВДАННЯ DATA MINING. ПРОГНОЗУВАННЯ І ВІЗУАЛІЗАЦІЯ (2 год.)

Лекція 6. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. ДЕРЕВА РІШЕНЬ (2 год.)

Лекція 7. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. МЕТОД ОПОРНИХ ВЕКТОРІВ. МЕТОД "НАЙБЛИЖЧОГО СУСІДА". БАЙЄСОВА КЛАСИФІКАЦІЯ (2 год.)

Лекція 8_1. МЕТОДИ КЛАСИФІКАЦІЇ І ПРОГНОЗУВАННЯ. НЕЙРОННІ МЕРЕЖІ (1 год.)

Лекція 8_2. НЕЙРОННІ МЕРЕЖІ. САМООРГАНІЗУЮТЬСЯ КАРТИ КОХОНЕНА (1 год.)

Лекція 9. МЕТОДИ КЛАСТЕРНОГО АНАЛІЗУ. ІЄРАРХІЧНІ МЕТОДИ (2 год.)

Лекція 10. МЕТОДИ КЛАСТЕРНОГО АНАЛІЗУ. ІТЕРАТИВНІ МЕТОДИ (2 год.)

Лекції 11-12. МЕТОДИ ПОШУКУ АСОЦІАТИВНИХ ПРАВИЛ (4 год.)

TEXT MINING (2 год.)

Лекція 13_1. ІНТЕЛЕКТУАЛЬНИЙ АНАЛІЗ ТЕКСТУ (1 год.)

Лекція 13_2. ПЛАГІАТ (0,5 год.)

Лекція 13_3. АНАЛІЗ ТОНАЛЬНОСТІ ТЕКСТУ (0,5 год.)

УНІВЕРСАЛЬНІ ПРИНЦИПИ DATA MINING (4 год.)

Лекція 14. ПРИНЦИПИ КОНТЕН ТА ІНТЕНТ-АНАЛІЗІВ (2 год.)

Лекція 15. АНАЛІЗ ДАНИХ В СОЦІАЛЬНИХ МЕРЕЖАХ (2 год.)

ВИКОРИСТАННЯ DATA MINING В ТЕОРІЇ ПРИЙНЯТТЯ РІШЕНЬ (6 год.)

Лекція 16. КЛАСИФІКАЦІЯ ЗАВДАНЬ ТА МЕТОДІВ ПРИЙНЯТТЯ РІШЕНЬ (2 год.)

Лекція 17. КРИТЕРІЇ ПРИЙНЯТТЯ РІШЕНЬ. ТЕОРЕТИЧНИЙ МАТЕРІАЛ (2 год.)

Лекція 18. МАТРИЧНІ ІГРИ (2 год.)

Усього 36 год.

Деякі теми можуть переставлятися місцями чи доповнюватися на розсуд викладача. Кількість годин, відведених на певну тему. Теж може змінюватися.

Лабораторні заняття

Тематично-календарний план проведення лабораторних занять

Лабораторна робота Тема Години
1 Заняття Вступне 2
2 Лабораторна робота 1 Методи обробки експериментальних даних 4
3 Лабораторна робота 2 Стохастичні методи пошуку 4
4 Лабораторна робота 3

Методи видобування асоціативних правил

з великих масивів даних

4
5 Лабораторна робота 4 Дерева вирішальних правил 4
6 Лабораторна робота 5 Ієрархічні методи кластерного аналізу 4
7 Лабораторна робота 6 Неієрархічні методи кластерного аналізу 4
8 Лабораторна робота 7 Модель прогнозування часових рядів за вибіркою максимального подібності 4
9 Лабораторна робота 8 Метод головних компонент 4
10 Тест Підсумковий 2

Всього на лабораторні заняття виділено 36 годин.

Самостійна робота студента/аспіранта

Самостійна робота студентів складається з:

Самостійна робота

Тема 1. Що таке DATA MINING? 1
Тема 2. Методи і стадії DATA MINING 1
Тема 3. Завдання DATA MINING 1
Тема 4. Завдання DATA MINING. Класифікація та кластеризація 1
Тема 5. Завдання DATA MINING. Прогнозування та візуалізація. 1
Тема 6 . Основи аналізу даних 1
Тема 7. Методи класифікації і прогнозування. Дерева рішень 1
Тема 8. Методи класифікації і прогнозування. Метод опорних векторів. Метод "Найближчого сусіда". Байєсова класифікація 1
Тема 9. Методи класифікації і прогнозування. Нейронні мережі 2
Тема 10. Нейронні мережі. Самоорганізуються карти Кохонена. 2
Тема 11. Методи кластерного аналізу. Ієрархічні методи 2
Тема 12. Методи кластерного аналізу. Ітеративні методи. 2
Тема 13. Методи пошуку асоціативних правил 2
Тема 14. Інтелектуальний аналіз тексту 2
Тема 15. Плагіат 2
Тема 16. Аналіз тональності тексту 2
Тема 17. Принципи контен та інтент-аналізів 2
Тема 18. Рекомендаційні системи 2
Тема 19. Теорія розпізнавання образів 2
Тема 20. Аналіз даних в соціальних мережах 2
Тема 21. Класифікація задач та методів прийняття рішень. 2
Тема 22. Загальна постановка однокритеріальної задачі прийняття рішень 2
Тема 23. Багатокритеріальні задачі прийняття рішень. 2
Тема 24. Прийняття рішень в умовах невизначеності 2
Тема 25. Теорія ігор. Класифікація ігор. 1
Тема 26. Матричні ігри. 1
Тема 27. Нескінченні антагоністичні ігри 1
Тема 28 Безкоаліційні ігри 1
ВСЬОГО 48

Політика та контроль

Політика навчальної дисципліни (освітнього компонента)

Форми організації освітнього процесу, види навчальних занять і оцінювання результатів навчання регламентуються Положенням про організацію освітнього процесу в Національному технічному університеті України «Київському політехнічному інституті імені Ігоря Сікорського».

Політика виставлення оцінок: кожна оцінка виставляється відповідно до розроблених викладачем та заздалегідь оголошених студентам критеріїв, а також мотивується в індивідуальному порядку на вимогу студента; у випадку не виконання студентом усіх передбачених навчальним планом видів занять (лабораторних робіт, тесту) до екзамену він не допускається; пропущені заняття обов’язково мають бути відпрацьовані.

Студенти можуть додатково до завдань курсу проходити аналогічні дистанційні курси, але рейтингові бали за це зараховуватися не будуть. Це пов’язано з неможливістю контролю дотримання студентами принципів академічної доброчесності при їх проходженні та із тим, що всі студенти мають знаходитися в однакових умовах при вивченні курсу.

**Відвідування є обов'язковим (**за винятком випадків, коли існує поважна причина, наприклад, хвороба чи дозвіл працівників деканату). Якщо студент не може бути присутніми на заняттях, він все одно несете відповідальність за виконання завдань, що проводились в комп’ютерному класі.

Порядок зарахування пропущених занять. Відпрацювання пропущеного заняття з лекційного курсу здійснюється шляхом підготовки і захисту реферату за відповідною темою у вигляді презентації. Захист реферату відбувається відповідно до графіку консультацій викладача, з яким можна ознайомитись на кафедрі. Відпрацювання пропущеного лабораторного заняття здійснюється шляхом самостійного виконання завдання і його захисту відповідно до графіку консультацій викладача.

Реферати також можуть підготувати студенти, у яких недостатньо рейтингових балів.

Політика академічної поведінки та доброчесності: конфліктні ситуації мають відкрито обговорюватись в академічних групах з викладачем, необхідно бути взаємно толерантним, поважати думку іншого. Плагіат та інші форми нечесної роботи неприпустимі. Всі індивідуальні завдання студент має виконати самостійно із використанням рекомендованої літератури й отриманих знань та навичок. Цитування в письмових роботах допускається тільки із відповідним посиланням на авторський текст. Недопустимі підказки і списування у ході захисту лабораторних робіт, на контрольних роботах, на іспиті.

Норми академічної етики: дисциплінованість; дотримання субординації; чесність; відповідальність; робота в аудиторії з відключеними мобільними телефонами. Повага один до одного дає можливість ефективніше досягати поставлених командних результатів. При виконанні лабораторних робіт студент може користуватися ноутбуками. Проте під час лекційних занять та обговорення завдань лабораторних робіт не слід використовувати ноутбуки, смартфони, планшети чи комп’ютери. Це відволікає викладача і студентів групи та перешкоджає навчальному процесу. Якщо ви використовуєте свій ноутбук чи телефон для аудіо- чи відеозапису, необхідно заздалегідь отримати дозвіл викладача.

Дотримання академічної доброчесності студентів й викладачів регламентується кодекс честі Національного технічного університету України «Київський політехнічний інститут», положення про організацію освітнього процесу в КПІ ім. Ігоря Сікорського.

Види контролю та рейтингова система оцінювання результатів навчання (РСО)

РОЗПОДІЛ БАЛІВ, ЯКІ ОТРИМУЮТЬ СТУДЕНТИ НА ЛАБОРАТОРНИХ ЗАНЯТТЯХ

Види контролю бали
Лабораторні роботи (8 робіт) 8 (5 балів – виконання роботи, 4 бали – захист)
Тест 28

*RD=*8*9+28=100

Захист лабораторних робіт відбуватиметься у формі проходження тестів з відповідної теми. За бажанням студент може виконати ще додаткові лабораторні роботи.

Календарний контроль: провадиться двічі на семестр як моніторинг поточного стану виконання вимог силабусу.

За результатами навчальної роботи за перші 9 тижнів максимально можлива кількість балів – 27 балів. На першій атестації (8-й та 9-й тиждень) студент отримує “зараховано”, якщо його поточний рейтинг не менше 20 балів.

За результатами 13 тижнів навчання максимально можлива кількість балів – 62 балів. На другій атестації (14-й тиждень) студент отримує “зараховано”, якщо його поточний рейтинг не менше 50 балів.

Семестровий контроль: залік

1. Студенти, які набрали протягом семестру кількість балів (і при цьому всі МКР не нижче ніж на оцінку “задовільно”), мають можливість:

  • отримати залік з кредитного модуля «автоматом» відповідно набраного рейтингу;

  • виконувати залікову контрольну роботу з метою підвищення оцінки.

Якщо оцінка за залікову контрольну роботу більша ніж «автоматом» за рейтингом, студент отримує оцінку за результатами залікової контрольної роботи. Інакше – застосовується варіант жорсткої РСО: якщо студент хоче отримати вищу оцінку, його попередні бали анулюються і він пише залікову роботу, яка оцінюється в 100 балів.

2. Студенти, які наприкінці семестру мають рейтинг виконують залікову контрольну роботу. При цьому рейтингова оцінка з кредитного модуля складається з балів за залікову контрольну роботу і ця рейтингова оцінка є остаточною.

3. Студенти, які наприкінці семестру мають рейтинг до заліку не допускаються і повинні виконувати додаткову роботу для підвищення свого рейтингу*.*

Таблиця відповідності рейтингових балів оцінкам за університетською шкалою:

Кількість балів Оцінка
100-95 Відмінно
94-85 Дуже добре
84-75 Добре
74-65 Задовільно
64-60 Достатньо
Менше 60 Незадовільно
Не виконані умови допуску (<40) Не допущено

Додаткова інформація з дисципліни (освітнього компонента)

Теми рефератів для отримання додаткових балів:

1. Інтелектуальні інформаційні системи.

2. Історія теорії дейтамайнінгу та напрямки розвитку.

3. Сфери застосування дейтамайнінгу в бізнесі та промисловості.

4. Використання концепції web- та text-mining.

5. Класи процесів та основні види закономірностей дейтамайнінгу.

6. Основні методи дейтамайнінгу.

7. Метод побудови дерева рішень.

8. Вилучення правил, як представник логічних методів дейтамайнінгу.

9. Метод «найближчого сусіда».

10. Метод CBR.

11. Статистичні методи дейтамайнінгу.

12. Методи візуалізації даних.

13. Загальна характеристика та приклади універсальнихтсистем дейтамайнінгу.

14. Огляд модулів дейтамайнінгу в статистичних пакетах.

15. Універсальні програмні системи дейтамайнінгу.

16. Загальна характеристика, архітектура, інструментарій та приклади використання компоненту Oracle9i Data Mining.

17. Загальна характеристика, архітектура, інструментарій та приклади використання компоненту DB2 Intelligent Miner (компанії IBM).

18. Загальна характеристика, архітектура, інструментарій та приклади використання служби Analysis Services в Microsoft SQL Server 2000.

19. Загальна характеристика, архітектура, інструментарій та приклади використання пакету Knowledge Studio (компанії Angoss Software).

20. Загальна характеристика, архітектура, інструментарій та приклади використання пакету SAS Enterprise Miner.

21. Загальна характеристика, архітектура, інструментарій та приклади використання пакету Clementine (Integral Solutions).

22. Загальна характеристика, пакету Polyanalyst (компанії Megaputer Intelligence).

23. Опис архітектури та інструментарію пакету Polyanalyst (компанії Megaputer Intelligence).

24. Приклади використання пакету Polyanalyst (компанії Megaputer Intelligence).

25. Загальна характеристика, архітектура, інструментарій та приклади використання пакету See5.

26. Загальна характеристика, архітектура, інструментарій та приклади використання пакету WizWhy.

27. Загальна характеристика, архітектура, інструментарій та приклади використання систем, які використовують метод CBR.

28. Загальна характеристика, архітектура, інструментарій та приклади використання пакету MineSet для візуального дейтамайнінгу (компанії Silicon Graphics).

29. Штучні нейронні мережі в інформаційних системах та їх історія.

30. Сфери використання штучних нейромереж.

31. Теоретичне підгруття штучних нейромереж.

32. Класифікація нейромереж.

33. Загальна характеристика, архітектура, інструментарій та приклади використання пакетів готового програмного забезпечення нейронних мереж.

34. Ідейна основа генетичних алгоритмів.

35. Теоретичне підгруття генетичних алгоритмів як спосіб вирішення задач оптимізації. Їх переваги та недоліки.

36. Загальна характеристика, архітектура, інструментарій та приклади використання готового програмного забезпечення генетичних алгоритмів.

37. Сфери застосування генетичних алгоритмів в бізнесі та промисловості.

38. Програмні агенти: визначення, типи та харакетристики програмних агентів.

39. Теоретичне пігрунття нечіткої логіки.

40. Нечіткий логічний висновок та його використання в економічних інформаційних системах.

41. Загальна характеристика, архітектура, інструментарій та приклади використання готового програмного забезпечення нечіткої логіки в народному господарстві.

42. Дейтамайнінг в торгівлі та маркетингу (аналіз купівельного кошика).

43. Дейтамайнінг в торгівлі та маркетингу (дослідження часових шаблонів продаж).

44. Дейтамайнінг в торгівлі та маркетингу (генерування прогностичних моделей покупців).

45. Дейтамайнінг в банківській справі (виявлення шахрайства з кредитними картакми).

46. Дейтамайнінг в банківській справі (сегментація клієнтів).

47. Дейтамайнінг в банківській справі (прогнозування змін клєнтури).

48. Дейтамайнінг в телекомунікаціях (аналіз про докладні характеристики викликів).

49. Дейтамайнінг в телекомунікаціях (виявлення лояльності клієнтів).

50. Дейтамайнінг в страховій справі (виявлення шахрайств).

51. Дейтамайнінг в страховій справі (аналіз ризику).

52. Дейтамайнінг в ріелторській справі (оцінка нерухомості).

53. Дейтамайнінг в логістиці (пошук оптимального логістичного ланцюжка).

54. Дейтамайнінг в електронній комерції  (для побудови рекомендаційних систем інтернет-магазинів).

55. Дейтамайнінг в електронній комерції  (для вирішення проблеми персоналізації відвідувачів).

56. Дейтамайнінг в происловості (прогнозування якості виробів в залежності від вимірюваних параметрів технологічного процесу).

57. Карта Кохенена.

58. Support Vector Machines.

59. Алгоритм покриття.

60. Алгоритм С4.5.

61. Алгоритм Apriori.

Робочу програму навчальної дисципліни (силабус):

Складено доцент, к.ф.-м.н., доцент, Гавриленко О.В.

Ухвалено кафедрою ІСТ (протокол №16 від 12.06.2024 р.

Погоджено Методичною комісією факультету (протокол №10 від 21.06.2024 р)