大数据的理解
❶ 什么是大数据,大数据可以做什么
大数据(big data),指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
大数据本身什么都做不了,能指望数据做什么呢。有大数据,如果不能通过数据
挖掘和数据分析得出对实际操作有价值的信息,那么它什么也做不了。
如果理解为对大数据的分析应用能做什么,那么它能做的事情就太多了,各个行业都会用到,物流、博彩、营销、客户管理、医疗、零售、环保等等都有其身影。
举例说明:
通过对客户进行分类整理,根据客户的购买习惯、年龄、喜好、地域等区分进行推荐产品,进行个性化的页面展示。还可以根据以往数据来进行动态营销。
零售,根据需求和库存的情况,适时调整价格
医疗,根据众多病人的特征,分析原因,量级太小的时候,这些特征根本不明显,不会得到重视,只有在大量数据中,才能发现平时注意不到的现象。
公共安全。根据以往犯罪数据预测发生犯罪事件的地区与概率。
娱乐。比如《纸牌屋》的制作公司根据以往的用户习惯,打造出大受欢迎的电视剧。
仅仅有大数据是远远不够的,更需要的是数据挖掘和数据分析的技能(包括大脑与软件操作),这样才能发挥出优势。如果愿意学习大数据的相关课程,有个“PPV课”的网站,课程很全面,可以学到很多关于大数据的知识,包括对案例的分析,还有软件操作等。
❷ 大数据是什么,大数据能做什么
大数据能做如下抄:
一、对信袭息的理解。你发的每一张图片、每一个新闻、每一个广告,这些都是信息,你对这个信息的理解是大数据重要的领域。
二、用户的理解。每个人的基本特征,你的潜在的特征,每个用户上网的习惯等等,这些都是对用户的理解。
三、关系。关系才是我们的核心,信息与信息之间的关系,一条微博和另外一条微博之间的关系,一个广告和另外一个广告的关系。一条微博和一个视频之间的关系,这些在我们肉眼去看的时候是相对简单的。
大数据专业术语:
1、apache软件基金会(asf)
提供了许多大数据的开源项目,目前有350多个项目。是专门为支持开源软件项目而办的一个非盈利性组织。在它所支持的apache项目与子项目中,所发行的软件产品都遵循apache许可证。
2、apachemahout
mahout提供了一个用于机器学习和数据挖掘的预制算法库,也是创建更多算法的环境。换句话说,是一个机器学习的天堂环境
3、apacheoozie
在任何编程环境中,需要一些工作流程系统来以预定义的方式和定义的依赖关系来安排和运行工作。oozie提供的大数据工作以apachepig,maprece和hive等语言编写。