大数据分析与计算体系架构研究

2022-09-12

随着现代信息化技术的不断发展, 人们的日常生活中也在逐渐的普及到网络信息技术。所以在整个社会层面中, 信息应用在不断的扩大着, 信息处理的难度在增加着。需要加强对大数据分析与计算的研究, 对其进行及时的改进和创新, 才能有效的解决现代网络信息爆发的问题, 进而保障数据信息的多样性、实用性。最有效的方式是建立大数据分析与计算体系架构, 能够对搜集的大数据进行准确的分析, 保证数据信息处理的正确性。

一、大数据分析与大数据计算的含义

(一) 大数据分析和大数据计算的特点

目前最热门的研究方向就是对大数据分析和大数据计算的方向, 各类行业的专家和学者都参与到研究过程中, 这就使得大数据分析和大数据计算成为目前最主流的发展方向。在国外, 大数据分析和大数据计算已经逐渐的应用在各行各业中, 并且带给各行各业的较多的实际好处。根据美国麦肯锡咨询机构最新发布的数据中可以看出, 大数据已经在金融行业、政府管理行业、零售行业、电商行业中发挥出巨大的作用, 提高了各行各业的实际销售额度。

(二) 如何利用大数据分析技术

在利用大数据分析技术中, 最先采用的是亚马逊所推出的“未下单, 先调货”计划。在这个计划当中, 主要应用大数据技术是对线上的购买数据进行分析与研究, 在用户浏览自己的应用时, 可以根据以往的浏览记录进行相应的推送, 并将其想要购买的货物, 提前送达到物流转运中心, 进而缩短物流时间, 提高用户的购买体验。并且在国内, 率先采用大数据分析技术的是阿里巴巴企业。通过对线上数亿级别的商品进行图像识别、大数据分析、三维建模等方式对商品进行检定, 确定是不是真正的品牌商品。采用大数据分析技术能够有效的挖掘深藏深处的有利信息, 能够保证决策的正确性。

(三) 大数据计算

大数据计算的应用可以认为是对众多信息数据进行计算, 找到有力的结果的过程, 这种数据计算方式比传统的数据方式, 提高了数据计算的准确性, 并且能够对其计算的过程进行详细的记录。在进行大数据计算的过程时, 采用主要的计算模式是对数据进行建立计算模型。计算模型是能够计算大数据最重要的基础, 已经对其研究了半个世纪之久。在20世纪40年代, Tuting针对计算数据信息的困难性, 因此提出了经典的图灵机计算模型, 在这之后, 越来越多的人对其进行改进和发展, 使其发展成目前应用广泛的大数据计算模型。在对大数据计算时, 需要对其进行建立大数据计算的构架, 才能够更加准确的计算出信息数据的结果。

二、大数据计算平台现状及存在的问题

大数据产品的主要的运作方式就是建立大数据计算平台, 大数据计算平台主要以云计算作为硬件基础, 并将其处理能力作为总体服务框架, 并对大数据进行实时计算的过程。大数据计算平台能够对不同种类的数据进行收集、分析、计算、存储、处理等处理, 这就使得各大企业都需要其应用, 能够对企业的内部产品进行相应的检验, 并组为技术基础, 能够处理相关的数据处理问题。但是在实际应用中, 大数据计算平台还存着较多的问题, 主要有以下几个方面:

(一) 平台研发需要交叉学科知识

在进行设计大数据计算平台时, 需要参考的知识方面涉及较多。大数据计算平台在实际应用中, 所计算的数据较多, 需要提高大数据的处理能力, 并降低自身能源的损耗、还需要增加企业平台自身的安全性和隐私性。所以在大数据计算平台研发时, 需要交叉学科知识共同应用, 进而对其进行创新和发展。

(二) 平台研发人才缺乏

在大数据的使用中, 但是由于大数据是新出的行业, 主要的研发人才还没有及时的到位, 并且相关的企业也并不重视大数据计算平台研发, 这就导致平台的研发严重的缺乏人才。在企业中, 实际应用平台搭建不完善, 不能承担大数据计算平台的使用, 所以无法对有关的项目进行处理;大数据技术还处在发展阶段, 很多软件都是开源的, 所以在进行应用时缺乏相关的安全性。

(三) 技术环境不统一

目前大数据技术开发的环境主要集中在GitHub为主的开源社区内, 其余的开发环境都是小众的, 所以这就使得大数据计算平台开发环境不统一。虽然可以根据用户的实际使用情况进行选择不同的平台, 但是在开发应用中, 却无形的提升了研发成本。

三、大数据分析

(一) 大数据分析基本概念

大数据的分析主要指的是能够对众多的数据进行统一的分析和研究。大数据分析主要应用的技术是云计算技术、计算机技术等先进的技术, 将这些技术应用到对数据的搜集、处理、分析、记录等统计行为中, 可以大幅度的提升数据处理的能力, 还能保证数据分析的准确性。大数据分析主要通过对算法的优化和建设数据模型进行分析, 能够将隐藏在大数据下的有用数据挖掘出来进行对其分析。在目前的大数据分析中, 所采用的主要分析方法有Bloom Filter、Hashing、索引、并行计算和Trie树等。大数据分析的数据不仅仅是用户产生的数据信息, 还能对半结构化和非结构化数据进行分析, 发现其中的问题, 然后针对产生的数据问题进行处理。

(二) 大数据分析的基础

大数据分析的基础是利用Hadoop技术对大数据进行处理, 在分析过程中, 还能对有用的信息进行记录。同时在其运行时, 还能结合其余的计算机的资源, 将众多的数据信息进行分摊计算, 极大地提升了大数据分析处理速度, 还能保留分析的过程与结果, 保证数据的延展性。Hadoop分布式文件系统 (HDFS) 是Hadoop技术的核心技术, 能够对大数据进行合理的分析, 并且能根据使用要求, 对数据进行保存处理, 将其存储到不同的计算机上, 保证分析数据的准确性和安全性。

四、大数据计算体系架构

(一) 大数据计算系统

大数据计算系统主要采用的设计方案较多, 其中所涉及的技术有软件分层化、技术复杂化等, 还依赖于较多的实际应用。但是在实际的系统建设中, 主要分为三个基础系统, 分别是数据存储系统、数据分析系统和数据分析系统。大数据的计算不仅涉及到算法的应用, 还应用了较多的数据分析技术。

(二) 大数据计算采用的方法和技术

在大数据计算中所采用的方法主要是计算机科学计算法和数学统计法, 在这其中还应用数据模型计算法、数据处理法、数据安全、算法优化法、数据读取和数据建模等方法。并且在大数据计算中采用了智能学习方法, 能够在对数据进行处理的过程中, 加强对数据的处理能力, 进而提升数据结果的准确性。

(三) 大数据计算总体架构

在进行铺设大数据计算总体架构时, 主要是将数据储存系统、数据分析系统和数据计算系统集合在一起, 然后对数据进行整体的处理。数据储存系统主要对数据进行收集、分析、和建模, 然后对处理的结果进行存储。而且在数据储存系统中还能对数据进行清洗建模、数据操作的操作。数据分析系统主要包括三维建模、数据模型和算法优化方式, 为大数据计算提供了数据分析能力和实际使用能力。数据计算系统主要能够对数据进行计算, 处理和分析, 保证处理数据准确性。

(四) 大数据的采集

在构建大数据计算体系时, 需要对大数据进行收集, 对数据的收集不仅仅是来源于实际的数据, 还包括结构化数据和非结构化的数据。由于数据的具有非结构化的特点, 所以在进行处理时, 大数据的存储系统比传统的数据存储要更加的复杂。并且在大数据计算体系中, 能够构建大数据采集于建模、分布式数据库等方式来提高数据处理能力。在进行数据处理时, 还需要在相关的数据库中添加多余的一项存储库, 能将处理后的数据进行储存, 方便后期对其调用。在构建大数据计算体系中, 需要按照标准进行搭建系统, 首先先建立数据层, 对数据进行收集和建模, 然后是建立分布式文件处理系统用来处理数据的采取, 并对数据进行转化, 使其被系统所是识别。在最上层需要建立分布式数据库, 可以对数据记性存储管理, 能够确保数据处理的稳定性。

(五) 大数据处理系统

大数据处理系统是大数据分析与计算体系架构的主要组成成分, 大数据处理系统主要分为四个层次, 分别是大数据算法、计算模型、计算平台和计算引擎。采用算法模式, 能够提升数据分析和数据预测的准确性, 主要分为算法、分析等。计算模型是位于大数据计算的最上面一层, 主要是根据数据的分析类型和处理方式来进行数据模型模拟。

五、结语

综上所述, 大数据分析与大数据计算都是能够将隐藏于众多数据中的有用数据挖掘出来并记录, 是主要的挖掘有用数据的方法。将挖掘出的有用信息进行研究与分析, 确定决策的发展方向。目前, 随着计算机技术的提升, 大数据计算也遇到了发展得问题, 尤其是在建设数据计算平台中遇到了平台研发人才缺乏、技术环境不统一的问题。这就容易导致大数据计算结果不再具有准确性, 进而使得制定决策时出现问题。但是如果不利用大数据计算采用传统的计算方式, 不能及时的满足企业的需求, 所以需要建立大数据分析与计算体系架构来加强对数据的处理和分析, 能够更好的做好大数据挖掘、大数据处理、大数据分析和大数据计算的工作。

摘要:随着现代经济社会实力的不断增加, 我国现代化信息技术也在迅速的发展着, 主要的应用是大数据分析与计算体系架构。其中可以分为大数据分析和大数据计算两大类。大数据分析能够从众多的数据信息中寻找到有用的信息, 是挖掘信息的最主要的方式。对有用的信息在进行深入的挖掘和分析, 进而能够为科学发展制定策略。大数据计算主要是对大量的数据进行总结和处理的过程, 能够有效的解决传统计算的问题, 保证数据的准确性。在结合两种大数据处理方式后, 构建大数据分析与计算体系架构, 既可以处理大量的数据信息, 还能对其中可利用的信息进行处理。

关键词:大数据分析,大数据计算,架构

参考文献

[1] 陆杉, 陈宇斌.供应链中大数据分析应用研究综述[J].商业经济与管理, 2018 (09) :27-35.

[2] 拉玛莫哈那劳·哥达吉利.人工智能=大数据分析+机器学习+云计算[J].重庆与世界, 2018 (18) :33-34.

[3] 龙虎.大数据分析与计算体系架构研究[J].信息与电脑 (理论版) , 2018 (18) :130-131+138.

[4] 张新淼.基于网络运维的大数据分析安全感知策略研究[J].网络安全技术与应用, 2018 (09) :67+35.

[5] 殷齐龙, 王军策.浅谈计算机大数据分析与云计算网络技术[J].信息与电脑 (理论版) , 2018 (17) :121-123.

[6] 张登耀.基于Hadoop分布式文件系统的商业银行大数据分析[J].山东农业大学学报 (自然科学版) , 2018 (05) :1-4.

[7] 陆万万.一种基于大数据的案件信息智能分析系统[J].计算机应用与软件, 2018, 35 (09) :153-156.

[8] 董蔚.面向大数据分析的系统建模研究[J].仪器仪表用户, 2018, 25 (10) :84-87.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:开胸术前高流量吸氧对术后呼吸系统并发症的影响下一篇:论高中历史“引导—探究—创新”教学模式的研究与实践