本篇文章1559字,读完约4分钟
近年来,数据生成的水平大幅提升,其特征是工业领域中许多企业的巨大数字化转型。全球生成的数据量正在迅速增长。事实上,根据行业媒体gigabitmagazine的研究,2020年产生的全球数据将比10年前增长25倍以上。此外,据估计,到2025年,累计产生的数据将增加两倍,达到近175兆字节。
目前,业务决策者对实时数据访问的需求也在快速增长,以便做出明智的业务决策。
为了使数据对他们的业务有用、可行和可扩展,企业需要一种有效和经济的方法来存储、标记和解释这些数据。实现这一目标的有利可图的方法之一是使用数据仓库。
这个概念可以追溯到20世纪70年代。当计算机科学家比利门提出“数据仓库”这个术语时,数据仓库市场就出现了。早期的数据仓库是作为一个本地服务器创建的,其构建能力只有千兆字节。从那以后,它们发生了重大变化,现代仓库可以容纳更大的容量。
数据仓库,也称为决策支持数据库,是指用于存储从一个或多个数据源(如事务系统和关系数据库)获得的信息的中央存储库。系统中收集的数据可以采用非结构化、半结构化或结构化数据的形式。然后,这些数据被处理、转换和使用,这样用户可以通过sql客户端、电子表格和商业智能工具更容易地访问它们。
数据仓库还促进了更容易的数据挖掘,即识别数据中的模式,然后可以用来促进更高的利润和销售。数据仓库行业的应用范围涵盖许多与分析甚至云计算相关的领域,在某些情况下,包括医疗保健、制造、电信和it、零售和政府等。
在技术领域,几家公司在推广数据仓库技术方面取得了很大进展。其中一家公司是teradata,一家在该领域拥有30多年经验的工业数据仓库公司。Teradata软件广泛应用于许多行业的各种数据仓库活动中,尤其是银行业。该公司一直致力于通过创新的新技术增强其商业智能解决方案,包括基于hadoop的服务。
大数据和数据仓库
在现代,大数据和数据科学正在极大地颠覆企业开展业务和决策过程的方式。由于跨行业的数据量如此之大,对高效大数据分析的需求变得至关重要。大数据出现在20世纪90年代,但这一概念可以追溯到计算机时代到来之前的术语创造,那时企业将使用大型电子表格来分析数字和研究趋势。
随着20世纪90年代末和21世纪初新数据源的出现,它们开始推动海量数据的生成。随着移动设备和搜索引擎的兴起,这一趋势尤其明显,搜索引擎可以输出比以往更多的数据。大数据出现的另一个特征是速度。数据生成得越快,需要的处理就越多。因此,在2005年,gartner将大数据的概念描述为3v的数据,即数量、速度和类型。
随着数据的持续快速增长,传统的关系数据库和数据仓库已经不能处理这些数据。为了避免这个问题并确保更高效的大数据分析系统,雅虎和其他公司的工程师在2006年创建了hadoop,这是一个带有分布式处理框架的apache开源项目,甚至可以在集群平台上运行大数据应用程序。
人工智能、机器学习和基于云的解决方案可能会推动数据仓库市场的未来前景
考虑到现代产生的数据量和处理数据所需的先进基础设施,决策支持数据库在技术和体系结构方面面临巨大的发展压力。除了几种新的数据仓库架构方法之外,从云计算服务到数据虚拟化,再到自动化和机器学习,许多技术已经出现并成为现代商业智能解决方案的主要贡献者。
基于云计算的解决方案是数据仓库市场的未来。随着许多企业转向云平台来支持和存储他们的数据仓库解决方案,像亚马逊和谷歌这样的互联网公司正不懈地致力于开发和托管基于云计算的创新数据仓库。
未来几年推动数据仓库行业未来的另一个趋势是机器学习和人工智能支持。新的数据仓库架构将成为人工智能数据集的基础,人工智能和机器学习将改进这些商业智能解决方案的功能和操作。这种趋势的一个例子是谷歌将机器学习集成到大查询数据仓库中。
标题:云计算将如何影响数据仓库技术?
地址:http://www.hcsbodzyz.com/hcxw/408.html