竞博JBO官网

0531-82560088

JBO体育

用能信息采集系统news

竞博JBO官网·晓谈数据工程6-数据架构

时间:2024-04-14   | 来源:JBO竞博体育首页登录 作者:JBO体育 浏览次数:7次

  数据架构是数据系统的蓝图,它服务于产品的业务需求,并描述数据如何收集、存储、转换和分发。它由需要实施和遵循的数据模型、治理策略、规则和标准组成,以构建强大且安全的数据系统。

  业务需求可能包括以下内容:1. 减少数据交付的延迟2. 根据需求自动扩展数据交付3. 为不同类型数据的数据模型增加更多灵活性4. 提高数据质量和一致性5. 减少存储成本和支持优化6. 提供安全性和 GDPR 等准则合规性

  1. 业务案例的最佳数据源和摄取工具2. 高效检索和存储优化的数据仓库解决方案3. 定义数据相关性和消费的转换逻辑4. 设计分析推理平台展示 KPI5. 使用云服务进行分布式计算,以确保最低成本和不同团队的访问权限6. 制定安全控制和监控系统以遵守法规并维护数据完整性。

  Lamba 架构被定义为具有实时和批处理能力的组合。它有 3 层:实时层,用于使用 Storm 或 Flink 等服务处理传入流;批处理层,用于使用 Hadoop 或 Spark 等服务批量处理历史数据;服务层,提供批处理和实时的组合视图数据。例如,在电子商务业务中,需要客户(批次)的购买历史记录来了解预算和质量限制,并需要实时浏览数据以提出合适的建议。

  Lambda 架构面临的挑战是,您需要为实时层和批处理层复制预处理和其他常见工作,因此建议对这两种提取使用相同的服务,例如 Spark,它有助于完成这两种操作。

  Kappa 架构的引入是为了采用统一的方法来应对这一挑战,并且只有一个流层,使用 Apache Kafka 等服务来处理所有操作。首先,实时数据存储在消息传递引擎中,并且可以存储在分析数据库中以便批量检索,或者根据查询类型通过服务层提供与消息传递引擎的实时交互。

  Kafka 是一种快速、容错且水平可扩展的服务,具有如下所示的许多功能,因此主要用于实现 Kappa 架构。

  虽然 Lambda 的维护和运营成本更高,但 Kappa 使系统更加简单。但为了建立 Kappa 架构,需要不断调整它以确保可靠性和准确性。

  因此,总而言之,当存在无法实时处理的大量或多种数据时,会使用 Lambda 架构,而当需要根据传入的流数据 Kappa 和中的数据立即采取行动时,会更倾向 Kappa 架构。数据具有高度一致性的情况,因此不需要太多的质量校正或复杂性。

  澄清:我仅在 AWS 和 Snowflake 中使用了免费套餐服务。我认为,当所有服务都在 AWS 中时,理解为什么使用 Airflow 而不是 Glue ETL 可能会令人困惑——这只是成本因素。

  我在这里进行免费试用,因此存在一些限制,但如果您更舒服并且适合您的用例,您可以使用 Glue Studio 进行 ETL 和仓库连接!

  该数据源包含有关电动汽车充电站的各种信息,您可以使用经度和纬度范围进行查询,以查找该区域的电动汽车充电站。

  AWS Glue 用于通过存储元数据的爬网程序和数据目录来理解数据架构。还可以使用 Glue通过 Glue Studio 对数据进行相关转换,然后再将其加载到 Snowflake 数据仓库中。也可以定义可从 Lambda 函数调用的 ETL 作业或对其进行调度。在ETL作业中,还可以执行数据质量检查。

  它用于对原始数据进行数据清理和预处理,并将中间结果存储到另一个清理后的S3存储桶中。每次将新数据加载到原始 S3 存储桶中时,都可以触发它。

  可以使用 Athena 执行 SQL 查询来了解数据并将查询结果存储在分析数据库中以供数据仓库访问。

  它是最终用户(数据分析师)使用的分析存储,用于了解趋势和模式并构建仪表板以向相关利益相关者展示。

  身份和访问管理允许您设置定义对不同 AWS 资源的访问控制的角色和策略。您需要定义上述每个 AWS 资源的角色才能相互交互。

  总之,使用 Airflow 从 API 进行摄取,当 S3 存储桶放置对象事件发生时会触发 Lambda,然后当有可用的清理对象时,可以使用 Snowflake 触发加载。

竞博JBO官网

JBO竞博体育首页登录

JBO体育

JBO体育

销售电话:0531-82560088,18653155353     联系人:王经理    传真:0531-88986351

总部地址:济南市高新区天辰路978号元隆生物 1号楼4层

工厂地址:山东省济南市高新区港西路1777号山东省环保产业研发基地1号车间

 
QQ在线咨询
咨询热线
0531-82560088