ТЕХНОЛОГІЇ МАШИННОГО НАВЧАННЯ - Робоча програма навчальної дисципліни (Силабус)

Реквізити навчальної дисципліни

Рівень вищої освіти Перший (бакалаврський)
Галузь знань 12 «Інформаційні технології»
Спеціальність 126 «Інформаційні системи та технології»
Освітня програма Інформаційні системи та технології
Статус дисципліни Обов’язкова (нормативна)
Форма навчання Очна (денна)
Рік підготовки, семестр ІV курс, весняний семестр
Обсяг дисципліни 4 кредити ECTS /120 годин (36 годин лекцій, 18 годин лабораторних робіт, 66 годин самостійної роботи студентів)
Семестровий контроль/ контрольні заходи Екзамен/тестування, МКР, захист лабораторних робіт
Розклад занять

18 лекцій (36 годин) 1 раз на тиждень;

4 лабораторні роботи (18 годин) 1 раз на 2 тижні.

Мова викладання Українська
Інформація про
керівника курсу / викладачів

Лектор: професор, д.т.н., професор Онищенко Вікторія Валеріївна ntu.kpi.ist@gmail.com

Лабораторні роботи: асистент кафедри ІСТ Коломоєць Сергій Олексійович serhii.o.kolomoiets@ukr.net

Розміщення курсу

Програма навчальної дисципліни

Опис навчальної дисципліни, її мета, предмет вивчання та результати навчання

Силабус освітнього компонента «Технології машинного навчання» складено відповідно до освітньої програми підготовки бакалаврів «Інтегровані інформаційні системи» спеціальності 126 – Інформаційні системи та технології.

Метою навчальної дисципліни є ознайомлення студентів із концепціями, методами та інструментами, які використовуються в області машинного навчання. Основні цілі включають:

  1. Розуміння Основ: Надання студентам теоретичних знань щодо основних понять машинного навчання, таких як навчання з учителем, навчання без учителя, Навчання з підкріпленням, ансамбльні методи та інші.

  2. Навички Роботи з Даними: Навчання студентів збирати, обробляти та аналізувати дані, оскільки якість даних має велике значення для ефективного машинного навчання.

  3. Ознайомлення з Алгоритмами: Вивчення різних алгоритмів машинного навчання, включаючи класифікацію, регресію, кластеризацію та інші, разом з їхнім впровадженням та використанням у різних сценаріях.

Формування та закріплення у студентів наступних компетентностей: (КС 6) Здатність використовувати сучасні інформаційні системи та технології (виробничі, підтримки прийняття рішень, інтелектуального аналізу даних та інші), методики й техніки кібербезпеки під час виконання функціональних завдань та обов’язків.(КС 16) Здатність інтегрувати програмні, технічні, інформаційні та інтелектуальні компоненти усіх рівнів ієрархії інформаційно-керуючих систем в єдину розподілену систему

Предмет навчальної дисципліни –Основні аспекти, які включає предмет машинного навчання:

Основи Машинного Навчання: Вивчення основних концепцій та термінів, таких як навчання з учителем, навчання без учителя, Навчання з підкріпленням, функції витрат, тощо.

Методи та Алгоритми: Розгляд різних методів та алгоритмів машинного навчання, включаючи лінійну регресію, дерева рішень, метод опорних векторів, нейронні мережі та інші.

Обробка та Аналіз Даних: Засоби для попередньої обробки та аналізу даних перед їх використанням для тренування моделей машинного навчання.

Інструменти та Бібліотеки: Використання популярних інструментів та бібліотек для розробки та реалізації моделей машинного навчання, таких як TensorFlow, PyTorch, Scikit-Learn та інші.

Програмні результати навчання, на формування та покращення яких спрямована дисципліна: (ПРН 16) Застосовувати знання відповідних мов програмування та ефективно

використовувати методи машинного навчання в задачах створення компонентів

штучного інтелекту в інформаційних система з використання аналізу та оцінки

складності алгоритмів рішення

Пререквізити та постреквізити дисципліни

Для успішного засвоєння дисципліни студент повинен володіти освітніми компонентами «Вища математика», «Теорія ймовірностей і математична статистика». Компетенції, знання та уміння, одержані в процесі вивчення освітнього компонента є необхідними для подальшого вивчення освітніх компонентів «Переддипломна практика», «Дипломне проєктування».

Зміст навчальної дисципліни

Тема 1. Вступ до машинного навчання

Тема 2. Проект машинного навчання

Тема 3. Основні алгоритми навчанняю. Регресійний аналіз

Тема 4. Основні алгоритми навчанняю. Класифікація

Тема 5. Виявлення аномалій

Тема 6. Базові алгоритми навчання

Тема 7-8.Асоціативні правила. Кластеризація

Тема 9. Оцінка ефективності моделі

Тема 10. Нейронні мережі

Навчальні матеріали та ресурси

Основна література

Основна література

  1. Кононова К. Ю. Машинне навчання: методи та моделі / К. Ю. Кононова. – Харків: ХНУ імені В. Н. Каразіна, 2020. – 301 с.

  2. Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python. 2016. 394 р.

  3. Luis Pedro Coelho, Wilhelm Richert, Matthieu Brucher. Building Machine Learning Systems with Python. 2018. 406 р.

  4. Michie, D.J. Spiegelhalter, C.C. Taylor. Machine Learning, Neural and Statistical Classification. 1994. 298 р.

  5. Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin. Learning From Data. 2012. 213 р.

  6. Tom M. Mitchell. Machine Learning. 1997. 414 р.

Додаткова література

  1. Raschka S. Python Machine Learning / S. Raschka, V. Mirjalili. – Birmingham: Packt Publishing, 2019. – 770 p.

  2. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. 2016. 800 р.

  3. Jeroen Janssens. Data Science at the Command Line. 2021. 282 р.

  4. John D. Kelleher, Brian Mac Namee, Aoife D'Arcy. Fundamentals of Machine Learning for Predictive Data Analytics. 2020. 856 р.

Навчальний контент

Методика опанування навчальної дисципліни (освітнього компонента)

Лекційні заняття

з/п

Назва теми лекції та перелік основних питань

(перелік дидактичних засобів, посилання на інформаційні джерела)

1

Тема 1. Вступ до машинного навчання

Лекція 1. Введення в машинне навчання.

Основні питання: Що таке машинне навчання. Для чого використовується машинне навчання Типи систем МН. Навчання з вчителем и без вчителя. Навчання з підкріпленням. Пакетне і динамічне навчання. Навчання на основі зразків і моделей. Основні проблеми МН. Недостатній розмір даних. Нерепрезентативні данні. Данні поганої якості, Несуттєві признаки. Перенавчання та недонавчання даних.

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

2-3

Тема 2. Повний проект МН.

Лекція 2-3. Повний проект МН.

Основні питання: Робота з реальними даними. Вияснення картини Формулювання завдання Вибір критерію якості роботи. Перевірка допусків, Отримання даних. Загрузка даних Швидкий погляд на структуру даних. Створення досліджуваного набору. Візуалізація даних. Пошук звязків, Експерименти з комбінуванням атрибутів. Підготовка даних для алгоритмів МН. Очистка даних. Обробка атрибутів. Маштабування признаків. Спеціальні трансформатори та конвеєрна трансформація. Вибір і навчання моделі. Навчання і оцінка за допомогою навчального набору даних. Точне налаштування моделі Решітковий пошук. Рандомізований пошук. Ансамблеві методи. Аналіз кращих моделей. Оцінка моделі Оцінка з допомогою досліджуваного набору. Запуск, дослідження і супровід системи.

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

4

Тема 3. Основні алгоритми навчання. Регресійний аналіз

Лекція4. Регресійний аналіз

Основні питання: Апроксимація(підгонка) лінії до точок даних. Апроксимація(підгонка) довільних кривих до точок даних. Перевірка ефективності алгоритмів регресії. Застосування регресії до реальних даних

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

5

Тема 4. Основні алгоритми навчанняю. Класифікація

Лекція5 Основні алгоритми навчання. Коротке введення в класифікацію

Основні питання: Запис формальних позначень. Застосування логістичної регресії. Робота з матрицею неточностей. Знайомство з багатокласовою класифікацією

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

6

Тема 4. Основні алгоритми навчанняю. Класифікація

Лекція6. Основні алгоритми навчання. Практичні рішення при роботі з лінійною та логістичною регресією

Основні питання: Підгонка прямої. Обробка інтерактивних ефектів. Підгонка нелінійних зв’язків. Зниження дисперсії за допомогою регуляризації. Зменшення кількості ознак за допомогою ласо-регресії. Тренування бінарного класифікатора.Тренування мультикласового класифікатора. Зниження дисперсії за допомогою регуляризації. Тренування класифікатора на дуже великих даних. Обробка незбалансованих класів

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

7

Тема 5. Виявлення аномалій

Лекція7. Метод k-найближчих сусідів і виявлення аномалій

Основні питання: аномалії, метод k-найближчих сусідів і приклади реалізації на python

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

8-9

Тема 6. Базові алгоритми навчання

Лекція 8-9. Метод опорних векторів. Наївний байєсівський метод

Основні питання: Алгоритми методу опорних векторів та наївного Байєсу і приклади реалізації на python

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

10-11

Тема 6. Базові алгоритми навчання

Лекція 10-11. Дерева рішень,випадкові ліси

Основні питання: Алгоритми методу дерева рішень,випадковий ліс і приклади реалізації на python

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

12-13

Тема 7-8.Асоціативні правила. Кластеризація

Лекція 12-13. Методи інтелектуального аналізу даних

Основні питання: Кластеризацiя методом k-сеpeднiх. Метод главних компонент. Асоціативні правила

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

14-16

Тема 9. Оцінка ефективності моделі

Лекція 14-16 Практичні основи. Проблеми і вирішення

Основні питання: Суть навчання з підкріпленням. Методи Монте-Карло: модельно-орієнтований та безмодельний. Методи бутсрепінгу: SARSA, Q-навчання. Дослідження невідомого середовища: епсілон-жадібна стратегія.

Використання моделей машинного навчання..

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

17

Тема 10. Нейронні мережі

Лекція 17 Штучні нейронні мережи

Основні питання: Штучний нейрон (визначення, навчання персепртона)

Алгоритм навчання персептрона, навчання моделі персептрона на наборі даних Iris

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

18

Тема 10. Нейронні мережі

Лекція 18 ЗАСТОСУВАННЯ нейронних мереж

Основні питання: Аналіз зображень та відео методами машинного навчання.

Застосування машинного навчання для аналітики. Застосування машинного навчання в сфері медицини. Застосування методів машинного навчання для прогнозування подій.

Допоміжні матеріали*: https://drive.google.com/drive/folders/1ox8bzpDhAdSpuIgU1ee50J_VS0OXpdTq?usp=drive_link

Лабораторні роботи

з/п

Перелік лабораторних робіт
1

Лабораторна робота №1. Метрики якості задач класифікації

Мета роботи – отримати знання основних метрик якості бінарної класифікації і варіантів тонкого налаштування алгоритмів класифікації.

2

Лабораторна робота №2. Функції помилок (втрат) у машинному навчанні

Мета роботи – отримати знання і критерії застосування основних використовуваних у сучасному машинному навчанні функцій помилок (функцій втрат).

3

Лабораторна робота №3. Вступ до опрацювання природної мови

Мета роботи – здобуття студентом навичок реалізації базових методів обробки природної мови, включно з попереднім опрацюванням тексту, формуванням «мішка слів» («bag-of-words»), виділенням стоп-слів і найважливіших слів у документі, створенням тематичних моделей.

4

Лабораторна робота №4. Згорткові мережі та робота з зображеннями

Мета роботи – отримати навички реалізації згорткової мережі та методу перенесення навчання.

Самостійна робота студента

з/п

Вид самостійної роботи

Кількість

годин СРС

1 Підготовка до лабораторних робіт 40
3 Підготовка до МКР 6
4 Підготовка до екзамену 20
66

6. Контрольна робота

Метою контрольної роботи є закріплення та перевірка теоретичних знань із освітнього компонента, набуття студентами практичних навичок самостійного вирішення задач та складанні та компіляції програм.

Модульна контрольна робота (МКР) виконується після вивчення Розділів 1-3 та після Розділу 4. Контрольна робота проводяться у формі тесту. Кожен студент отримує індивідуальний набір питань.

Політика та контроль

Політика навчальної дисципліни (освітнього компонента)

Курс складається з 18 лекційних та 9 лабораторних занять.

За курс необхідно виконати 4 лабораторні роботи (13,13,12,12 балів). Додатковий бал дає проходження курсу Cisco Python - max 10 балів або Cisco DevNet- max 10 балів (за власним вибором та бажанням). Курс - завершено з отриманням сертифікату!

На лекціях з теоретичного матеріалу будуть експрес-контрольні та МКР – max 50 балів за семестр

Лабораторні роботи

Ваговий бал. Лабораторні роботи 1-2 мають ваговий бал 13, а лабораторні роботи 3-4 мають ваговий бал 12. Максимальна кількість балів за всі лабораторні роботи складає 13 балів * 2 роботи + 12 балів * 2 роботи = 50 балів.

На лабораторних роботах студенти перевіряють працездатність написаних програм або схем за попередньо вирішеними вдома задачами. Для допуску до поточної лабораторної роботи необхідно мати Протокол, оформлений відповідно до норм оформлення технічної документації, який має містити всі необхідні пункти, відповідно до Методичних вказівок. Також для допуску до лабораторної роботи (окрім 1-ї) необхідно захистити попередню. Студенти, що не захистили попередню лабораторну роботу можуть бути не допущені до виконання наступної. Лабораторні роботи можуть виконуватись як самостійно так і бригадою.

Критерії оцінювання лабораторної роботи:

- вірно виконаний синтез всіх задач, продемонстрована працездатність всіх програм (схем), вірні відповіді на запитання до захисту, вчасно виконана робота – 13 балів за 1-2 лабораторні, 12 балів за 3-4 лабораторні;

- за несвоєчасність виконання лабораторних робіт 1-2 знімаються 3 бали, за несвоєчасність виконання лабораторних робіт 3-4 знімаються 2 бали;

- вірно виконаний синтез всіх задач, продемонстрована працездатність всіх програм (схем), відповіді на питання до захисту мають неточності – знімаються 2 бали від максимальної кількості;

- виконаний синтез всіх задач, але деякі з них містять помилки або неточності, продемонстрована працездатність не всіх програм (схем), відповіді на питання до захисту мають неточності – знімаються від 3 до 5 балів від максимальної кількості;

- лабораторна робота не виконана або протокол не представлений – повертається на відпрацювання або доопрацювання.

Якщо студент отримує 60 балів і більше (за умови що ВСІ 4 лабораторні роботи захищені !, студент іспит може не складати, за умови згоди, т.т. отримує оцінку автоматично.

ІСПИТ: отримані бали за семестр Х ½ + бал екзаменаційної роботи (max 50 балів)

Екзаменаційна робота складається з двох частин: 25 балів за теоретичну частину (форма тест), 25 балів – задача з практичною реалізацією (міні аналог лабораторних робіт)

Види контролю та рейтингова система оцінювання результатів навчання (РСО)

Поточний контроль: вправи на лекційних заняттях, тестування, МКР, виконання та захист лабораторних робіт.

Календарний контроль: провадиться двічі на семестр як моніторинг поточного стану виконання вимог силабусу.

Календарний контроль базується на поточній кількості зарахованих лабораторних робіт. Умовою отримання першого календарного контролю є зарахована перша лабораторна робота, другого календарного контролю – зараховані 2 лабораторні роботи.

Семестровий контроль: екзамен.

Умови допуску до семестрового контролю: виконані та захищені лабораторні роботи, виконані завдання до практичних занять, семестровий рейтинг більше 30 балів.

Таблиця відповідності рейтингових балів оцінкам за університетською шкалою:

Кількість балів Оцінка
95-100 Відмінно
85-94 Дуже добре
75-84 Добре
65-74 Задовільно
60-64 Достатньо
Менше 60 Незадовільно
Менше 30 Не допущено

Загальна рейтингова оцінка студента після завершення семестру складається з балів, отриманих за:

  • тестування з лекційних занять;

  • виконання та захист лабораторних робіт;

  • виконання модульної контрольної роботи (МКР);

  • відповіді на екзамені.

Тестування по лекціям Лабораторні роботи МКР Екзамен
10 50 40 50

Робочу програму навчальної дисципліни (силабус):

Складено професором кафедри ІСТ, д.т.н., проф. В.В.Онищенко

Ухвалено кафедрою ІСТ (протокол № 21 від 29.06.2023)

Погоджено Методичною комісією факультету (протокол № 11 від 29.06.2023)