Apache Pig
¿Que es?
Plataforma para el análisis de grandes conjuntos de datos
¿Cuando se desarrolló?
desarrollado por Yahoo en el año 2006 y adoptado por la Apache Software Foundation a partir del año 2007
¿Qué es Pig Philosophy?
Es definir una serie de enunciados que resumen el proyecto, mediante una similitud con el nombre
Pigs eat anything
Pigs live anywhere
Pigs are domestic animals
Pigs Fly
Pig puede operar con cualquier tipo de dato, sea éste estructurado, semi-estructurado o no estructurado
No solo se enfoca en Hadoop. Su propósito es ser un lenguaje de procesamiento paralelo
Diseñado para ser controlado y modificado fácilmente por sus usuarios
Procesa datos rápidamente. La intención es mejorar el rendimiento y no las características
¿Quienes lo usan?
AOL y WhitePages
Yahoo!