数据挖掘与云计算
云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉专及通过互联网来提供动态易属扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。
数据挖掘是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
模糊计算以模糊集理论为基础,它可以模拟人脑非精确、非线性的信息处理能力,在许多应用领域内都有用途。由于模糊计算方法可以表现事物本身性质的内在不确定性,因此它可以模拟人脑认识客观世界的非精确、非线性的信息处理能力。亦此亦彼的模糊逻辑。
② 云计算,大数据,数据挖掘,机器学习,模式识别。这些概念之间的关系是怎么样的
给你解释一下这些术语:
云计算:就是个炒得很热的商业概念,其实说白了就是将计算任务转移到服务器端,用户只需要个显示器就行了,不过服务器的计算资源可以转包。当然,要想大规模商业化,这里还有些问题,特别是隐私保护问题。
大数据:说白了就是数据太多了。如今几兆的数据在20年前也是大数据。但如今所说的大数据特殊在哪呢?如今的问题是数据实在是太多了,这已经超过了传统计算机的处理能力(区别与量子计算机),所以对于大数据我们不得不用一些折衷的办法(比如数据挖掘),就是说没必要所有数据都需要精确管理,实际上有效数据很有限,用数据挖掘的方法把这些有限的知识提取出来就行了。·此外,数据抽样,数据压缩也是解决大数据问题的一些策略。
数据挖掘:从数据中提取潜在知识,这些知识可以描述或者预测数据的特性。有代表性的数据挖掘任务包括关联规则分析、数据分类、数据聚类等,这些你在任一本数据挖掘教材都可以了解。下面我说说和大数据的区别:数据挖掘只是大数据处理的一个方法。马云所说的大数据,或者如今商业领域所说的大数据,实际上指的就是数据挖掘,其实真正所谓大数据,或者Science杂志中提到的大数据,或者奥巴马提出的大数据发展战略,我的理解是,这些都远远大于数据挖掘的范畴,当然数据挖掘是其中很重要的一个方法。真正目的是如何将大数据进行有效管理。
机器学习:这个词很虚,泛指了一大类计算机算法。重点是学习这个词,如果想让计算机有效学习,目前绝大多数方法都采用了迭代的方法。所以在科研界,只要是采用了这种迭代并不断逼近的策略,一般都可以归到机器学习的范畴。此外,所谓学习,肯定要知道学什么,这就是所谓训练集,从训练集数据中计算机要学到其中的某个一般规律,然后用一些别的数据(即测试集)来看看学得好不好,之后才能用于实际应用。所以,选取合适的训练集也是个学问。
模式识别:意思就是模式的识别。模式多种多样,可以是语言,可以是图像,可以是事物一些有意义的模块,这些都算。所以总体来说,模式识别这个词我是觉得有点虚,倒是具体的人脸图像识别、声音识别等,这些倒是挺实在的。也许是我不太了解吧。
另外说说你的其他问题。
传统分析方法不包括数据挖掘。对于数据分析这块我不是很了解,不过可以肯定的是,传统分析都有一定的分析方向,比如我就想知道这两个商品的关联情况,那我查查数据库就行了。数据挖掘虽说有些历史,不过也挺时髦的,它是自动将那些关联程度大的商品告诉你,这期间不需要用户指定数据分析的具体对象。
如果想应对大数据时代,数据挖掘这门课是少不了的。此外对数据库,特别是并行数据库、分布式数据库,最好了解点。至于机器学习和模式识别,这些总的来说和数据挖掘关系不太大,除了一些特殊的领域外。
总之,概念挺热,但大数据还很不成熟,无论从研究上还是商业化上。我目前在作大数据背景下的算法研究,说实话,目前基本没有拓展性非常强的算法,所以未来大数据的发展方向,我也挺迷茫。
PS:将数据挖掘应用于商业,最最重要的就是如何确定挖掘角度,这需要你对具体应用的领域知识非常了解,需要你有非常敏锐的眼光。至于数据挖掘的具体算法,这些就交给我们专门搞研究的吧!(对算法的理解也很重要,这可以把算法拓展到你的应用领域)
③ 计算机研究生请进!本人是今年刚考上计算机专业的研究生,由于开学才分方向,想问一下云计算与数据挖掘这
1、本人92年开始玩计算机至今,和计算机相关的几乎玩遍了,所以建议你既然是偏软方向,搞数据挖掘去吧,云计算很多都涉及到大型机、服务器、网格计算等和硬件、网络相关的,既然不喜欢就回避。
2、数据挖掘目前应用最多的是商业智能分析方面,我国的军事数据挖掘才刚刚起步,没法和美国高盛公司相比,高盛是军用、商用、民用全搞的;当前我国要搞的车联网、物联网、智慧城市、电子商务等,全部都需要数据挖掘,通过数据挖掘找出数据中的关联性,因此通常都是使用一定的软件先初级归类筛选,然后人工根据数据结果,使用sql语句或者自己写代码,对特定特殊数据再次做分析和验证,因此对大型数据库,软件开发有非常高的要求,否则搞不定,尤其是现在的海量数据和内存型数据库,不懂的话,基本上是老虎吃天,所以我对你在学校能学到多少本事非常怀疑,我不相信这些最尖端的技术,学校里面有老师自己已经能掌握透彻,并且还能教学生,我们自己也是几个月前这些东西出来,自己在跟着学,根本没有教材可以看,只能看对应的外文论坛和官方技术资料。从发展来看,数据挖掘如果你毕业了,刚好是先锋,能走多高多远,看你自己的造化,因为国家发展、政策指定,都需要国家统计局除数据,数据挖掘使他们的本行,实际上他们做的极差,统计还行,分析凑合,挖掘完全不靠谱;
3、不清楚你个人能力和爱好,所以没法继续推荐。
④ 大数据和云计算的区别
大数据和云计算的区别:
1)目的不同:大数据是为了发掘信息价值,而云计算主要是通过互联网管理资源,提供相应的服务。
2)对象不同:大数据的对象是数据,云计算的对象是互联网资源以及应用等。
3)背景不同:大数据的出现在于用户和社会各行各业所产生大的数据呈现几何倍数的增长;云计算的出现在于用户服务需求的增长,以及企业处理业务的能力的提高。
4)价值不同:大数据的价值在于发掘数据的有效信息,云计算则可以大量节约使用成本。
不看现在云计算发展情况,未来的趋势是:云计算作为计算资源的底层,支撑着上层的大数据处理,而大数据的发展趋势是,实时交互式的查询效率和分析能力,借用Google一篇技术论文中的话:“动一下鼠标就可以在妙极操作PB级别的数据”,确实让人兴奋不能止。
大数据分析经常和云计算联系到一起,因为实时的大型数据集分析需要像MapRece一样的框架来向数十数百或甚至数千的服务器分配工作,大数据需要特殊的技术,以有效地处理大量数据。适用大数据的技术,包括大规模并行处理数据库、数据挖掘电网、分布文件系统、分布式数据库、计算平台、互联网和可扩展的存储系统,大数据指的海量的数据一般日处理PB级别以上,一般用于挖掘,分析,做一些智能性商业板块。
大数据必然与云计算有相关(大数据和云计算没有必然的联系,你要作大数据,可以用云计算,也可不用)数据中心是云计算基础,从技术上来看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,大数据必然无法用单台的计算机进行处理,必须采用分布式的架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算分布式处理、分布式数据库和云存储、虚拟化等技术,随着云时代的来临,大数据也吸引了越来越多的关注。