Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data science (наука про дані)- розділ інформатики, що вивчає проблеми…
Data science (наука про дані)- розділ інформатики, що вивчає проблеми аналізу, обробки і представлення даних в цифровій формі. Об'єднує методи по обробці даних в умовах великих обсягів і високого рівня паралелізму, статистичні методи, методи інтелектуального аналізу даних і додатки штучного інтелекту для роботи з даними, а також методи проектування і розробки баз даних.
Галузі впливу
машинний переклад
розпізнавання мови
робототехніка
пошукові системи
цифрова економіка
біологічні науки
комп'ютерні технології в медицині
охорона здоров'я
гуманітарні дисципліни
Візуалізація даних
. Процес побудови графічного образу даних, що допомагає у процесі загального аналізу даних вбачати аномалії, структури.
Основний рівень. На цьому рівні інфраструктура візуальних обчислень є інтегрованою системною платформою, що забезпечує візуальні додатки необхідними обчисленнями й обчислювальними ресурсами. Зазвичай роль системного інтегратора полягає у визначенні необхідних інструментів, початковій ініціалізації обчислювальних ресурсів та керування розподілом даних. Інколи йому надаються засоби керування для прийняття технічних рішень, таких як: безпека даних, застосування паралельних обчислень, авторизація тощо.
Керівний рівень.
Особливістю цього рівня є наявність в інфраструктурі системи керованих сервісів, що забезпечують зв'язок між інтерфейсом користувача й системною платформою. Згадана система сервісів містить інформацію щодо наявності даних і ресурсів та призначена для обслуговування візуальних додатків відповідно до динамічних потреб користувачів. Ефективне керування додатками забезпечується підтриманням сучасних сервісних функцій (інтерактивних, розподілених, мобільних) для здійснення задач візуалізації.
Прогнозний рівень.
Ознакою цього рівня є наявність інформаційного прошарку між інтерфейсом користувача й сервісним забезпеченням, метою якого є збирання, відслідковування й виправлення даних взаємодії користувача й системного виконання. Прогнозований рівень забезпечує користувачів аналітичними даними, які можуть показати якість результатів візуалізації й ефективність візуальних інструментів. Крім того, застосування інформаційного прошарку дає змогу здійснити швидшу й кращу специфікацію завдання, відображаючи можливі задачі й рекомендуючи необхідні інструменти й візуальне подання.
Адаптивний рівень.
На цьому рівні спроектована інфраструктура містить адаптивний прошарок, особливістю якого є те, що, ґрунтуючись на зібраній інформації, спроектована система здійснює процедури самоконфігурування, самооптимізації й самовідновлення.
Автономний рівень.
Ознакою цього рівня є заміна звичного інтерфейсу користувача на інтелектуальний, допускає перетворення інформації на знання й забезпечує користувача розширеною довідкою. Він може охоплювати специфікацію завдань візуалізації, планування взаємозалежних робіт, організацію неопрацьованих даних та результатів візуалізації, керування безпекою, перевірку якості обслуговування й результатів, організацію розподілу даних між користувачами.
Аналіз даних.
Data Mining — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.
методи розв'язання
Регресійний аналіз. Регресійний аналіз займається методами аналізу залежності однієї величини від іншої. На відміну від кореляційного аналізу, не з'ясовує, чи істотний зв'язок, а займається пошуком моделі цього зв'язку, вираженої у функції регресії.
Еволюційні алгоритми
Дерева рішень. Метод для розв'язання задачі класифікації. Результатом застосування цього методу до навчального матеріалу є ієрархічна структура правил типу «якщо … тоді … інакше …». Ця структура має вигляд дерева. Для визначення приналежності об'єкта до одного з класів слід надавати відповіді на запитання, що знаходяться у вершинах цього дерева. Розпочавши з кореня дерева, алгоритм завершується після досягнення тупикової вершини (листа), ця вершина і визначатиме клас, до якого належить об'єкт.
Нейронні мережі. Дозволяють реалізовувати задачі кластеризації, класифікації, прогнозування. Після створення основ теорії нейронних мереж, вони зазнали значної критики і вважалося, що вони малопридатні для сфери штучного інтелекту. Проте відновленню інтересу до штучних нейронних мереж сприяв розвиток комп'ютерів та успіх в теоретичних та прикладних дослідженнях.
Обробка даних.**
Сукупність операцій (збирання, введення, записування, перетворення, зчитування, зберігання, знищення, реєстрація), що здійснюються за допомогою технічних і програмних засобів, включаючи обмін по каналах передачі даних
аналітико-синтетична обробка
статистична обробка
системна обробка
автоматизована обробка