当前位置:主页 > 游戏服务器 > 主机安全 >

域名解析_mysql删除数据库_高性价比

SAP Predictive Analytics 3.2发布的新的基于SQL的推荐程序是优化您的业务的强大工具

基于SQL的推荐程序是一个机器学习系统,能够处理数百万笔交易,大数据怎么样,并快速准确地预测用户最有可能购买的项目。

推荐系统已变得越来越重要近年来流行起来,由于现代在线商务的增长,它被用于电影、音乐、新闻和书籍等多种销售领域。

在线商务摆脱了实体商务的物理限制,销售了大量呈指数级增长的产品。

例如,一家书店,书架空间有限,只能展示已出版书籍的一小部分,通常只有少数最近的畅销书。

在线商务可以通过其更大的分销渠道提供更多的选择,并利用"长尾"现象,新零售企业应用中心,低需求和低销量的产品可以共同带来更大的利润盈利能力强于目前为数不多的畅销书。

要想获得成功,店铺淘客,在线企业必须在对购物车进行详细分析的基础上,为个人客户量身定制产品推荐。

这个过程包括,首先,从所有客户中提取重复的产品选择,建立关联规则,然后,将规则应用于特定客户。

从最新版本3.2开始,基于SQL的推荐程序是APL(SAP Automated Predictive Library)的一部分。它基于Apriori算法的原理。

关联规则告诉你:对于购买a项(称为先行项)的客户,该客户可能购买的下一个B项是什么(称为后续项)。

这些原理首先发现客户一起购买产品的概率,并将这些组合表示为关联规则。关联规则告诉您,人工智能行业分析,对于购买项目a(称为前件)的客户,下一个项目B(称为后件)是客户最有可能购买的项目。

SQL Recommender允许您基于不同的度量来评估关联:

依赖于发现的关联规则,然后,您可以向客户推荐他们最有可能购买的商品。

基于SQL的推荐程序完全在SAP HANA中实现。它提供了高性能执行的好处,所有处理都在SAP HANA SQL引擎的核心完成。

基于SQL的推荐程序的使用非常简单。提供三个程序:

请参考APL安装中的示例(folder samples/sql/procedure/APL\u samples/recommender)。

"百万歌曲"数据集是构建推荐系统的知名公共数据集。

https://www.kaggle.com/c/msdchallenge#描述。

包含4900万笔交易行。

基于SQL的推荐程序展示了令人印象深刻的性能:

在4900万行的事务表上训练模型需要11分钟,生成3500万条关联规则,2分钟将这些关联规则应用于130万个事务行中的11万个用户4300万个推荐项目(每个用户大约500个推荐项目)

这个实验是在一台物理SAP HANA机器上完成的:

80个逻辑CPU/40核/Intel(R)Xeon(R)CPU E7-4870 2.4GHz,512GB内存SAP HANA HANA version 1.0 sps12.

以MAP表示的精度(平均精度)为15.94%,是畅销书的7倍。评估准确度的另一种方法是通过"精确度"x"回忆"图表。这两个指标表达了预测好项目的能力和发现所有潜在好项目的敏感性之间的权衡。人们通常会注意精确回忆曲线下的区域。曲面越高(接近1.0),模型就越能预测正确的项目,并以有意义的顺序覆盖最大数量的相关项目。

下面的图表显示了在百万首歌曲数据集上应用基于SQL的推荐器的精确召回图。我们可以看到它的表面曲线(橙色线)基本上是以上的一个"畅销书为主"。这意味着在任何情况下,SQL Recommender提供了比向客户推荐畅销书的基本方法更大的价值。

这一性能相当于Kaggle排名前三的竞争对手之一。以下截图中显示的"得分"数字确实是地图数字。

另一个实验是用从数据集(另一个著名的公共数据集)中提取的一系列数据集进行的。

目的是观察当事务数据集的大小增加时响应时间的变化:

不到1分钟的时间来训练模型不到1200万笔交易。不到3分钟就可以在2000万个事务上训练模型。

基于SQL的推荐程序是一个经过验证的、可扩展的解决方案,适用于大型数据集和产品目录。

它依赖于纯基于SQL的实现。该体系结构非常简单,大数据和数据分析区别,本机集成到功能强大的SAP HANA平台中。

猜你喜欢

微信公众号