Please enable JavaScript.
Coggle requires JavaScript to display documents.
¿QUE ES LA BIG DATA? (LA NUBE Y LA COMPUTACIÓN EN LA NUBE (LOS SERVICIOS…
¿QUE ES LA BIG DATA?
LA NUBE Y LA COMPUTACIÓN EN LA NUBE
DESDE LA PERSPECTIVA DE UNA PERSONA, MEDIANTE LOS SERVICIOS EN LA NUBE, USTED PODRÁ:
ALMACENAR TODOS SUS DATOS, COMO IMÁGENES, MÚSICA, PELÍCULAS Y CORREOS ELECTRÓNICOS, Y ASÍ LIBERAR ESPACIO EN EL DISCO DURO LOCAL
ACCEDER A SUS DATOS Y APLICACIONES EN CUALQUIER LUGAR, EN CUALQUIER MOMENTO Y EN CUALQUIER DISPOSITIVO
ACCEDER A MUCHAS APLICACIONES EN LUGAR DE DESCARGARLAS EN SU DISPOSITIVO LOCA
UNA COLECCIÓN DE CENTROS DE DATOS O GRUPOS DE SERVIDORES CONECTADOS.
EL ACCESO AL SOFTWARE
LOS SERVICIOS DISPONIBLES EN LOS SERVIDORES,
EL ALMACENAMIENTO
LOS SERVICIOS DE ALMACENAMIENTO EN LA NUBE SON PROPORCIONADOS POR DIFERENTES PROVEEDORES
GOOGLE DRIVE
APPLE ICLOUD
MICROSOFT ONEDRIVE
DROPBOX.
LOS SERVICIOS EN LA NUBE SON PROPORCIONADOS POR GRANDES EMPRESAS COMO:
GOOGLE
APPLE.
MICROSOFT
PROCESAMIENTO DISTRIBUIDO
LA CANTIDAD DE DATOS ERA ADMINISTRABLE Y RELATIVAMENTE FÁCIL DE DEPURAR.
CON LA EXPLOSIÓN DE LOS SISTEMAS DE AUTOMATIZACIÓN EMPRESARIAL Y EL CRECIMIENTO EXPONENCIAL DE LAS APLICACIONES WEB
LOS DATOS GENERADOS POR MÁQUINAS
EL ANÁLISIS SE TORNA CADA VEZ MÁS DIFÍCIL DE PROCESAR. DE HECHO
EL 90% DE LOS DATOS QUE EXISTEN ACTUALMENTE SE GENERÓ SOLO EN LOS ÚLTIMOS DOS AÑOS.
LA MAYORÍA DE LOS SISTEMAS DE ARCHIVOS DISTRIBUIDOS
DISEÑADOS PARA SER INVISIBLES POR LOS PROGRAMAS DEL CLIENTE.
EL SISTEMA DE ARCHIVOS DISTRIBUIDOS LOCALIZA LOS ARCHIVOS Y TRANSFIERE DATOS
LOS USUARIOS NO PUEDEN SABER QUE LOS ARCHIVOS ESTÁN DISTRIBUIDOS ENTRE MUCHOS SERVIDORES O NODOS DIFERENTES.
LOS USUARIOS TIENEN ACCESO A ESTOS ARCHIVOS COMO SI FUERAN LOCALES EN SUS PROPIAS COMPUTADORAS.
EL AUMENTO DEL VOLUMEN DENTRO DE UN PERÍODO BREVE ES UNA PROPIEDAD DEL CRECIMIENTO EXPONENCIAL
EN LUGAR DE PROCESAR GRANDES BASES DE DATOS CON COMPUTADORAS CENTRALES GRANDES Y POTENTES, Y ALMACENARLAS EN ARREGLOS DE DISCOS GIGANTES
EL PROCESAMIENTO DE DATOS DISTRIBUIDOS TOMA EL VOLUMEN DE DATOS DE GRAN TAMAÑO Y LO DIVIDE EN PARTES MÁS PEQUEÑAS.
EL ALTO VOLUMEN DE DATOS ES DIFÍCIL DE PROCESAR Y ANALIZAR DENTRO DE UNA CANTIDAD DE TIEMPO RAZONABLE.
LOS DATOS MASIVOS
LOS DATOS
SON LA INFORMACIÓN QUE PROVIENE DE UNA VARIEDAD DE FUENTES
TEXTO
SENSORES
IMÁGENES
SITIOS WEB
LOS DATOS TAMBIÉN PROVIENEN DE
CAJAS REGISTRADORAS.
TABLETS
COMPUTADORAS
TELÉFONOS CELULARES
QUIOSCOS
SON UNA GRAN CANTIDAD DE DATOS
TIENEN UNA GRAN CANTIDAD DE DATOS QUE REQUIERE CADA VEZ MÁS ESPACIO DE ALMACENAMIENTO (VOLUMEN).
TIENEN DATOS QUE SE GENERAN EN DIFERENTES FORMATOS (VARIEDAD).
TIENEN UNA CANTIDAD DE DATOS QUE CRECE EXPONENCIALMENTE RÁPIDO (VELOCIDAD).
¿CUÁLES SON LOS DESAFÍOS DE LOS DATOS MASIVOS?
CADA DÍA CREAMOS 2,5 TRILLONES DE BYTES DE DATOS”. PARA CONFIGURAR ESTO EN CONTEXTO, CADA MINUTO DE CADA DÍA:
LE DAMOS ME GUSTA A CERCA DE 4 MILLONES DE PUBLICACIONES DE FACEBOOK.
PEDIMOS CERCA DE 14 MILLONES DE PRONÓSTICOS DE THE WEATHER CHANNEL.
CON LA CONSTANTE CREACIÓN DE ESTA ENORME CANTIDAD DE DATOS, LAS TECNOLOGÍAS TRADICIONALES Y LOS ALMACENES DE DATOS (DATA WAREHOUSES) NO PUEDEN CUMPLIR CON LAS NECESIDADES DE ALMACENAMIENTO
LOS CÁLCULOS DE DATOS MASIVOS DE IBM CONCLUYEN QUE
CARGAMOS CERCA DE 300 HORAS DE VIDEO DE YOUTUBE
ENVIAMOS CERCA DE 3,5 MILLONES DE MENSAJES DE TEXTO.
TRANSMITIMOS CERCA DE 86 MIL HORAS DE VIDEO DE NETFLIX
EL RÁPIDO CRECIMIENTO DE DATOS PUEDE SER UNA VENTAJA O UN OBSTÁCULO CUANDO SE TRATA DE LOGRAR LOS OBJETIVOS COMERCIALES.
SOPORTE DE EMPRESAS CON DATOS MASIVOS
FUENTES DE INFORMACIÓN
ADEMÁS DE LOS DATOS DE LOS SENSORES TAMBIÉN SON VARIADOS
OTROS DATOS SE ORIGINAN A PARTIR DE TODO LO QUE SE HA ANALIZADO
INTRODUCIDO Y DIVULGADO EN INTERNET DE FUENTES DE COMPARACIÓN ENTRE TIPOS DE TEXTO
ALGUNOS SON:
SITIOS DE REDES SOCIALES: FACEBOOK, YOUTUBE, EHARMONY Y TWITTER
HTTP, PÁGINAS WEB Y MOTORES DE BÚSQUEDA EN INTERNET
DATOS HISTÓRICOS DE ARCHIVOS PÚBLICOS Y PRIVADOS
LOS DATOS RECOPILADOS SE PUEDEN CLASIFICAR COMO ESTRUCTURADOS O NO ESTRUCTURADOS.
LOS DATOS ESTRUCTURADOS SE CREAN MEDIANTE APLICACIONES QUE UTILIZAN ENTRADAS DE FORMATO “FIJO”, COMO HOJAS DE CÁLCULO O FORMULARIOS MÉDICOS.
LOS ARCHIVOS DE VALORES SEPARADOS POR COMAS (CSV) SON UN TIPO DE ARCHIVO DE TEXTO SIMPLE QUE USA COMAS PARA SEPARAR COLUMNAS EN UNA TABLA DE DATOS
Y EL CARÁCTER DE RETORNO DE PÁRRAFO PARA SEPARAR FILAS.
CADA FILA ES UN REGISTRO. A PESAR DE SER COMÚNMENTE UTILIZADOS PARA IMPORTAR Y EXPORTAR EN BASES DE DATOS Y HOJAS DE CÁLCULO TRADICIONALES, NO EXISTE UN ESTÁNDAR ESPECÍFICO.