当前位置:主页 > 分布式数据库 >

专属服务器_马云华为_限时特惠

本文是我上一篇文章的延续,可以在这里访问。

下面是一个真实的案例场景,我最近为我的一个数据迁移项目实现了Join rank。使用join rank显著提高了性能,淘客分佣系统,速度提高了5倍。

场景:

我在SAP中加载了良好的接收数据,并希望将加载的数据与尝试加载的转换数据进行比较。这是为了跟踪在SAP中成功加载的内容和未能加载的内容。为此,自助建站开发,我需要将SAP表与转换后的表连接起来,并提取匹配的记录。因此,对于这个场景,我将使用Join Rank并在下面逐步解释过程。

在SAP Data Services中实现Join Rank的步骤。

步骤1:

使用以下转换创建数据流,该转换使用两个表作为源,一个SAP表和另一个转换表。使用了内部连接,关键字段为必填项。目标表将保留两个表中匹配的行。

步骤2:

打开MSEG表(双击该表),并将连接等级更改为30(默认连接等级为0)。以黄色突出显示。此表约有390万行。

第3步:

打开INR\ U GR\ U ENR表(转换表),并将Joni等级更改为10。此表有53500行。

表:来自SAP的MSEG行计数

实现:在我的上一篇文章中,您可以详细了解联接列组如何在数据服务中工作。

MSEG是最大的SAP表之一,有390万行。我的转换表(即INT\u GR\u ENR)有53500行要加载到SAP中。让我们假设53000行被成功加载,而500个好收据没有加载。所以,当我连接这两个表时,它将返回匹配的53000行。

当连接列未使用时发生了什么?

如果我只是在这两个表上使用内部联接,并且在不使用任何联接列组的情况下运行作业,则产生结果需要10分钟。

作业执行时间:10分钟

使用联接列组时发生了什么?

因此,由于在这种情况下不可能完全下推,比较便宜的云服务器,我在最大的表(即MSEG)上使用了30的联接秩,在第二个较小的表上使用了10的联接秩。由于MSEG具有更高的连接秩,因此它将是一个驱动表。现在结果有了很大的改善,我在2分钟内完成了任务,人工智能技术发展,比上一次运行快了5倍。

,大数据中心是什么

猜你喜欢

微信公众号