当前位置:主页 > 云存储 > 安全 >

云储存_高性能_怎样学习物联网

  • 安全
  • 2021-04-09 09:17
  • 动埠云

在Sap Analytics Cloud(SAC)中,您可以包含R组件。在这个博客中,我想试试我的手,并使用最佳运行演示数据,看看我可以创建什么。我想用R创建一个可视化的视图,并对数据进行一些分析。

将R组件添加到画布后,首先附加一个数据源。我添加了BestRun\u演示数据并选择Store ID列。

一旦进入R组件的脚本,就可以输入命令并在控制台中获取信息。例如,如果您输入这个命令

,那么控制台将给您以下答案。

但是今天的目标是看看我们是否可以创建一个漂亮的图形。因此,R中有可用的库。其中一个库是ggplot,虚拟主机,用于创建视觉效果。让我们从一个图形的基本命令开始,创建一个散点图,在这个散点图中我们绘制毛利率和折扣。我们确实解释了两者之间的关系。

使用geom\u smoot,您可以添加一条具有置信水平(阴影区域)的趋势线。在这种情况下,它看起来没有那么令人印象深刻。数据似乎是分组的,趋势线并不是很适合数据。

Kmeans

要创建组,我们将使用Kmeans。

这是k-means的定义

因此是一种简单的分组方法,你必须告诉它你期望多少组。

我们想根据毛利率、折扣和两者之间的比率进行分组。后者是因为云看起来是对角线的,消费返现,一个比率将有助于Kmeans将点按对角线排列。注意,我使用了一个函数scale来设置kmeandata。这将使一切都达到同样的规模。这避免了一个维度中数字越大影响越大的问题。

最后在ggplot中,我使用因子告诉ggplot,淘客公众号系统,这不是一个连续变量,而是4个独立的类别。

结果现在显示每个组有一个单独的颜色,数据分析和大数据,趋势线与组有相同的颜色。趋势线似乎也更符合数据。也许除了绿色的那一组之外,那一组线连接着两组不同的点。但你知道我们就这么做吗?

最终确定。

现在我们得到了一些很好的分组,一些有意义的趋势线。让我们用一个标题来结束这个过程,并创建一些片段。我将添加一条垂直线和一条水平线,根据毛利率和折扣的中位数创建四个区域。

这是最终产品。一个相当复杂的图形。Ggplot允许您从图形开始,并向画布添加越来越多的元素。这是一个很好的方式来添加这个。

最后的想法。有了R服务器中所有的标准库,您就有了大量的选项,大数据查询,不仅可以创建视觉效果,还可以进行一些机器学习,比如kmeans。总之,无论是在故事中还是在分析应用程序中,都有丰富的选项

  • 关注微信

猜你喜欢

微信公众号