Please enable JavaScript.
Coggle requires JavaScript to display documents.
SBUGHEA, Corina. Data Science and Some Instruments. Annals of the…
SBUGHEA, Corina. Data Science and Some Instruments. Annals of the University Dunarea de Jos of Galati: Fascicle [online]. 2017, 23(3), 87-93 [cit. 2019-01-04]. ISSN 15832074. Dostupné z:
http://search.ebscohost.com/login.aspx?direct=true&db=asn&AN=127821617&lang=cs&site=ehost-live
Vývojová prostředí pro R
R studio
R Commander
Programovací jazyky
Preferované pro analýzu dat
Python
Multiparadigmatický jazyk
Procedurální
Imperativní
Funkční
Objektově orientovaný
Interpretovaný jazyk
Multiplatformní
Jazyk vhodný spíše pro vědce
Kromě zpracování a vizualizace umožňuje vývoj komplexních aplikací
Považován za dostatečně flexibilní i komplexní pro potřeby programování i analýzy dat
Moderní programovací jazyk vhodný i pro začátečníky
Dle několika průzkumů se jedná o v současnosti nejrozšířenější programovací jazyk
Knihovny pro strojové učení
TensorFlow
Theano
scikit-learn
Problémy se zpětnou kompatibilitou Python 2.x a Python 3
R
Velmi užitečný jazyk pro analýzu dat
Interpretovaný jazyk
Pomalejší běh programu
Syntaktické chyby se projevují až za běhu
Stále aktivní vývoj
R Developer Core Team
Dialekt jazyka S (IBM 1976)
Komplexní jazyk
Vhodné pro lidi s matematickým a statistickým myšlením
Orientace na zpracování a vizualizaci dat
Problémy se správou paměti
Ostatní
C/C++
Nízkoúrovňové jazyky
Kompilovaný kód
Rychlý běh programu
Větší kontrola nad kódem a programem
Java
Scala
Považuje se za programovací jazyk s velkým potenciálem pro datovou analytiku
Multiparadigmatický jazyk
Funkční programování
Objektově orientovaný
Mocné knihovny pro:
Práce s databází
Tvorbu škálovatelných frameworků
Vhodná spíše pro programátory/inženýry jako náhrada Javy
Teoretický rámec
Data ~ z latinského
datum
= daný fakt
Datová věda - dle Jamese Nicholase Graye se jedná o čtvrté vědecké paradigma
Další vědecká paradigmata
Empirické paradigma
Teoretické paradigma
Výpočetní paradigma (computational)
Kontextualizací a subjektivním pochopením zprávy (dat) vznikají informace.
Datová věda
Automatizace
Technologie a metody pro
Sběr dat
Analýza dat
Příprava dat k dalšímu zpracování
Vizualizace
Práce s velkými daty
Cílem je získávání nových znalostí
Důležité aspekty dle Jeffrey Stanton
Komunikační dovednosti
Schopnost analyzovat data
Schopnost etického rozhodování
Dnešní společnost čelí přebytku dat/informační explozi
Je potřeba vyvíjet nástroje vypořádávající se s tímto fenoménem