Please enable JavaScript.
Coggle requires JavaScript to display documents.
大数据时代问题分析, 更混杂的数据量而不是更精确的算法, 大数据不只是优于少量数据, 而是创造更好的结果。, 世界不是贫乏规整的惨象,而是纷繁复杂的…
大数据时代问题分析
大数据时代思维变革
不是样本而是全部
小数据时代的随机取样
全数据模式,样本=总体
谷歌流感趋势预测
分析美国整个互联网检测记录,可以推测到某个城市的流感状况
Lytro相机
记录整个光场所有的光,具体生成的照片可以根据需要决定
乔布斯癌症治疗
对乔布斯DNA等全测序,根据特定基因组成按需用药
不是精确性而是混杂性
谷歌翻译
虽然搜集内容有错误翻译,但巨大语料库优势压倒缺点,使其好于布朗、微软的班科和布里尔、IBM的Candide
Facebook等社交网站
有用户随意贴标签分类照片
象棋残局
输入所有可能来表示完美无缺和不可战胜性
word语法检查
少量数据下表现最好的算法,但在大量增加数据量后表现差
不是因果关系而是相关关系
亚马逊推荐系统
根据产品间的联系推荐,增加100倍销售量
沃尔玛
飓风来临前将蛋塔和飓风用品摆在一起,可增加销量
基于相关关系的预测是大数据的核心
塔吉特与怀孕预测
美国折扣零售商通过对女性消费记录的分析,可以发现他是否怀孕,从而在相应阶段寄送相应的优惠券
U P S约汽车修理预测
UPS国际快递公司通过检测车辆的各个部位,提早更换需要更换的零件
早产儿病情诊断
实时监测病人信息,提早预防感染
大数据时代商业变革
一切皆可量化
坐姿转化成数据
孕育出服务和产业
汽车防盗系统
能识别是否是车主,不需要输入密码,错误则自动熄火
识别盗贼
通过收集数据识别
提醒疲劳驾驶
坐姿与行驶安全关系
通过分析安全事故发生前的坐姿变化情况
地板数据化
适时开灯开门
根据体重站姿,走路方式,确定个人身份
监控商店人流量
文字转变数据
谷歌数据图书馆
谷歌翻译
沟通转变为数据
微博
情绪数据化
来自世界不同文化的人,每天每周的心情都遵循着相似的模式
监听信微博发布频率预测
分析微博数据文本,作为股市投资信号
位置数据化
GPS
通过手机预测交通情况
处理来自手机的数据预测人类行为
流感时期通过分析每个人的行程,了解了他的联系方式和具体隔离措施
数据创新
数据再利用
网页流量监测揭示用户喜好——淘宝
数据重组
利用手机的用户信息与癌症患者信息见识手机是否增加致癌率——无关
扩展数据利用
零售店监控摄像头
零售店监控摄像头除了安全保卫还可以跟踪客流及客户停留的位置
数据折旧
及时剔除失去基本用途的数据,如亚马逊推荐系统,一般不用10年前客户买的书来进行推荐
数据废弃利用
谷歌根据用户点击的搜索结果所在位置来更正排名将更相关的提前
谷歌拼写检查反馈系统通过用户自行更正的搜索词或点击显示正确的拼音页面来完善
数据、技术、思维三足鼎立
数据拥有者
数据拥有者可以选择将数据授权给其他公司,如Microsoft;也可以自行开发分析,如master card
大数据技术公司
如微软Amalga系统,减少病人再次入院
大数据思维公司与个人
Flight caster预测航班晚点
数据中间商
大数据时代管理变革
风险——让数据主宰一切的隐忧
无处不在第三只眼
亚马逊监视着我们的购物习惯
谷歌监视着我们的网页浏览习惯
微博窃听到了我们心中的内容
Facebook 窃取我们的社交关系网
隐私被二次利用
大数据时代不管是告知与许可,模糊化还是匿名化的隐私,保护策略都没有效果
预测与惩罚
预测犯罪并提前制止。老年人需要交更多保险费。
这否定了人的自由权利公平,无法独立选择和自由意识
数据与独裁
过于信任依赖数据
掌控——责任与自由并举信息管理
个人隐私保护
让使用者承担责任
公司付有特定时间之后删除个人数据的义务
保护个人动因
反数据垄断大亨
程序员监控大数据并保持透明度
总结
大数据给我们提供的,不是最终答案,而是参考答案人类的作用依旧无法完全被替代。
更混杂的数据量而不是更精确的算法
大数据不只是优于少量数据, 而是创造更好的结果。
世界不是贫乏规整的惨象,而是纷繁复杂的天地间存在的事物,也远远多于系统想象。