Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data Science – це наука про методи аналізу даних і вилучення з них цінної…
Data Science – це наука про методи аналізу даних і вилучення з них цінної інформації та знань. Вона тісно пов’язана з такими галузями, як машинне навчання (Machine Learning), наука про мислення (Cognitive Science), а також з технологіями для роботи з великими даними (Big Data)
Обробка інформації́ — вся сукупність операцій (збирання, введення, записування, перетворення, зчитування, зберігання, знищення, реєстрація), що здійснюються за допомогою технічних і програмних засобів, включаючи обмін по каналах передачі даних
Автоматизована обробка інформації
Аналітико-синтетична обробка документів
Статистична обробка інформаці
Системна обробка інформації
Добува́ння да́них (англ. Data Mining), також глиби́нний ана́ліз да́них — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів
Нейронні мережі
Дерева рішень
Регресійний аналіз
Еволюційні алгоритми
Моделі
Prescriptive analytics
Machine learning for making predictions
Predictive causal analytics
Machine learning for pattern discovery
Життєвий цикл
Візуалізація даних – це графічна презентація інформації, завдяки якій можна лаконічно представити в зображенні те, що в текстовому еквіваленті займе не один абзац.
Методи і прийоми
Кладограмма (філогенез)
Дендрограмма (класифікація)
Візуалізація інформації еталонної моделі
Графік креслення
Теплова карта
Гіперболічне дерево
Багатовимірне шкалювання
Вирішення проблем навколишнього середовища
Treemapping
позначення Southbeach
Найпоширеніші способи візуалізації даних
графіки
діаграми
інфографіка
схеми
інтерактивний сторітеллінг
бізнес-аналітика
карти і картограми
Візуалізація часто використовується у таких галузях та формах
Статистика та звіти
Довідкова інформація
Ілюстрації
Рівні розвитку засобів візуалізації
Прогнозний рівень
Ознакою цього рівня є наявність інформаційного прошарку між інтерфейсом користувача й сервісним забезпеченням, метою якого є збирання, відслідковування й виправлення даних взаємодії користувача й системного виконання. Прогнозований рівень забезпечує користувачів аналітичними даними, які можуть показати якість результатів візуалізації й ефективність візуальних інструментів. Крім того, застосування інформаційного прошарку дає змогу здійснити швидшу й кращу специфікацію завдання, відображаючи можливі задачі й рекомендуючи необхідні інструменти й візуальне подання.
Керівний рівень
Особливістю цього рівня є наявність в інфраструктурі системи керованих сервісів, що забезпечують зв'язок між інтерфейсом користувача й системною платформою. Згадана система сервісів містить інформацію щодо наявності даних і ресурсів та призначена для обслуговування візуальних додатків відповідно до динамічних потреб користувачів. Ефективне керування додатками забезпечується підтриманням сучасних сервісних функцій (інтерактивних, розподілених, мобільних) для здійснення задач візуалізації.
Автономний рівень
Ознакою цього рівня є заміна звичного інтерфейсу користувача на інтелектуальний, допускає перетворення інформації на знання й забезпечує користувача розширеною довідкою. Він може охоплювати специфікацію завдань візуалізації, планування взаємозалежних робіт, організацію неопрацьованих даних та результатів візуалізації, керування безпекою, перевірку якості обслуговування й результатів, організацію розподілу даних між користувачами.
Адаптивний рівень
На цьому рівні спроектована інфраструктура містить адаптивний прошарок, особливістю якого є те, що, ґрунтуючись на зібраній інформації, спроектована система здійснює процедури самоконфігурування, самооптимізації й самовідновлення.
Основний рівень
На цьому рівні інфраструктура візуальних обчислень є інтегрованою системною платформою, що забезпечує візуальні додатки необхідними обчисленнями й обчислювальними ресурсами. Зазвичай роль системного інтегратора полягає у визначенні необхідних інструментів, початковій ініціалізації обчислювальних ресурсів та керування розподілом даних. Інколи йому надаються засоби керування для прийняття технічних рішень, таких як: безпека даних, застосування паралельних обчислень, авторизація тощо.
Інструменти моделювання
R має повний набір можливостей моделювання і забезпечує гарну середу для створення інтерпретуючих моделей.
Служби SQL Analysis можуть виконувати аналітику в базі даних, використовуючи загальні функції інтелектуального аналізу даних і основні інтелектуальні моделі.
SAS / ACCESS можна використовувати для доступу до даних з Hadoop і для створення повторюваних і багаторазових діаграм потоків.
вміння і навички