下载银行:你身边的资源,可信赖的下载站!
RapidMiner Studio

RapidMiner Studio v9.10.0 官方版

  • 大小:273M语言:简体中文更新日期:2021-09-10
  • 授权:免费软件类型:国外软件星级:
  • 平台:WinAll
  • 50%

大小:273M

RapidMiner是非常专业的数据分析处理软件,支持从各类文档中快速导入数据,反之也可以导出为多种数据格式。软件中有着非常强大智能的预处理功能,可以为后续的数据分析与使用节省更多的时间。此外它还包含了大量的算法,可以为数据快速生成各种模型。当然数据统计等功能也是有的,此外随着升级它的图形交互方面也做得越来越出色。

软件特色

1、数据访问

以任何规模连接到任何数据源,任何格式。

2、数据探索

快速发现模式或数据质量问题

3、数据混合

为预测分析创建最佳数据集。

4、数据清理

专业清理高级算法的数据。

5、造型

快速有效地构建和交付更好的模型。

6、验证

自信而准确地估计模型性能。

RapidMiner图片1

软件亮点

1、偏差检测和缓解

接收偏差警告在RapidMiner平台的每个部分,包括Turbo Prep,模型模拟器等。当Studio认为你的专栏可能会导致模型偏差时,你会收到一个警告,以及一个解释它是由什么触发的平台内标注。

2、流媒体和IIOT的进步

在低延迟(50-100ms)的用例中混合和匹配RapidMiner和Python,例如对大量传感器数据评分。此外,当创建设备异常检测模型、基于数据建模物理行为等时,利用新的功能拟合操作符将数据与自定义功能相匹配。

3、安全增强

对Docker无根模式的支持以及Kubernetes环境中增强的安全性都提高了我们的整体安全标准。通过使用最新的安全组件定期更新Docker映像,容器化平台的安全性也得到了提高。

4、时间序列预测

在RapidMiner Go中,基于历史数据自动预测单变量时间序列的未来值。在预测销售或人员需求时,跟踪先进的和季节性的趋势,并使用直观的可视化来比较竞争模型的结果。

5、NLP扩展

利用新的RapidMiner扩展进行自然语言处理,提取语音部分标签,并在自由文本中识别人、城市、组织和其他实体。这通常被用作一种预处理方法,用来确定文档、网站文本等的内容。

RapidMiner图片2

软件功能

数据访问

连接到任何格式,任何比例的数据源

比任何其他可视化设计平台更多的数据连接器

包括60多种文件类型和格式的结构化和非结构化数据

非结构化数据访问,加载和提取信息

80 +文本,网络和多媒体挖掘和处理功能

支持纯文本,HTML,PDF,RTF等

数据探索

强大的统计概述,快速探索和了解您的数据

图形显示属性名称和类型

快速识别缺失值

强大的图表引擎提供了超过30种不同的可视化选项

气泡图和三维散点图

网络和树状图,以及更多

数据准备

提供大量的数据质量,集成和转换工具

聚合、筛选和排序或连接数据的多个选项

具备用于特征选择,创建和提取的算子

确定最佳影响因素或产生新因素

高级属性加权功能

新属性生成选项

RapidMiner图片3

数据清洗

提供多种高级数据清理方法

识别和去除重复

异常值检测和删除

规范化&标准化

衡量属性影响的加权方案

提供复杂的降维技术

自组织映射(SOM)

建模

深度机器学习功能

分类,回归和聚类技术

关联挖掘,频数集合和相似性计算

集合和分层模型

超过100个额外的建模算子

无缝集成R,Python和自定义脚本

流程控制功能

优化循环和分支

模型验证

可视化设计界面与可靠验证技术

预处理模型

交叉验证&分割验证

视觉评价技术

值得信赖的性能估算

精确度,召回率,RMSE,AUC及其他

计算显著性检验

RapidMiner图片4

云执行

扩展计算 - 按需

并行提交多个作业

弹性计算环境

任何地方可进行预测分析

提供一个基于云的中央存储库

支持敏捷开发

软件优势

1、可视化工作流设计器

提高从分析师到专家的整个数据科学团队的生产力

在拖放式可视化界面中加速和自动化预测模型的创建

包含 1,500 多种 算法和函数的丰富库可确保为任何用例提供最佳模型

用于常见用例的预构建模板,包括客户流失、预测性维护、欺诈检测等

“众志成城”每一步都提供主动建议,帮助初学者

2、连接到任何数据源

处理您的所有数据,无论数据位于何处

立即创建指向数据库、企业数据仓库、数据湖、云存储、业务应用程序和社交媒体的点击式连接

随时轻松重复使用连接,并轻松与需要访问的任何人共享

通过RapidMiner 市场的扩展连接到新资源

3、自动数据库内处理

在数据库内运行数据准备和 ETL 以保持您的数据针对高级分析进行优化

无需编写复杂的 SQL 即可查询和检索数据

利用高度可扩展的数据库集群的力量

支持 MySQL、PostgreSQL 和 Google BigQuery

RapidMiner图片5

4、数据可视化与探索

评估数据健康、完整性和质量

通过散点图、直方图、折线图、平行坐标、箱线图等了解模式、趋势和分布

快速查找和修复常见的数据质量问题,包括缺失值和异常值

使用强大的统计概览和 30 多个交互式可视化来探索数据

5、数据准备和混合

消除为预测建模准备数据的麻烦

RapidMiner Turbo Prep 提供完全交互式的点击式数据准备体验

跨任意数量的源提取、连接、过滤和分组数据

创建可计划和共享的可重复数据准备和 ETL 流程

6、视觉和自动化机器学习

无需编写代码即可快速创建有影响力的机器学习模型

RapidMiner Auto Model 使用自动化机器学习在 5 次点击中创建模型

从数百种监督和无监督机器学习算法中进行选择

实施基本和高级 ML 技术,包括回归、聚类、时间序列、文本分析和深度学习

构建对成本等约束敏感的模型,以优化对所需业务影响的预测

使用自动和手动特征工程来优化模型准确性

7、模型验证

在部署到生产之前了解模型的真实性能

通过独特的方法消除过拟合,防止模型训练预处理数据泄漏到模型的应用程序中

只需单击鼠标,即可将经过验证的技术(例如交叉验证)添加到模型中

8、可解释的模型不是黑匣子

创建易于解释且易于理解的可视化数据科学工作流程

数据准备、建模和验证过程中的每个步骤都记录在案,以确保完全透明

视觉效果很容易向组织中的其他人解释以获得部署的支持

支持本地可解释模型不可知解释 (LIME) 框架

RapidMiner图片6

9、从 R 和 Python 代码中获取更多信息

编码人员和非编码人员之间的可扩展代码部署和协作

将基于代码的模型和包含代码的模型部署到可扩展的平台中

通过将您的代码片段上传到 RapidMiner 存储库以在简化的可视化工作流设计器中使用,消除重复工作并确保其他人重复使用您的工作

通过在专业和尖端库的基础上构建并使用 RapidMiner 将其提供给团队的其他成员,来利用充满活力的 Python 生态系统

利用其他人生成的数据准备和 ETL 管道

10、灵活的评分和模型操作

将预测洞察转化为业务影响

使用 RapidMiner AI Hub(以前称为 RapidMiner Server)将评分数据快速部署到电子表格和数据可视化工具,或将模型转换为生产网络服务

RapidMiner Model Ops 为不那么高级的用户提供了一种简单的方法来将模型投入生产并正确管理它们

与企业调度工具集成

添加 RapidMiner Real-Time Scoring 用于要求高交易/低延迟的用例

11、自动化和过程控制

构建复杂的可视化工作流程并自动执行重要任务

使用过程控制操作员创建重复和循环任务、分支流和访问系统资源的工作流

支持用于自定义集成和自动机的各种脚本语言

调度进程

12、开放和可扩展

与现有应用程序和代码集成

使用 R 和 Python 代码和库来扩展 RapidMiner

通过Github 上的RapidMiner Python 库将 RapidMiner 与 Python 集成

通过RapidMiner 市场下载由 RapidMiner、我们的合作伙伴和社区提供的新功能

通过其灵活的扩展机制为 RapidMiner 添加新功能

RapidMiner Studio 开放核心在AGPL 许可下可用

怎么导入数据

通常情况下我们都是需要将数据导入RapidMiner来进行使用的,不过根据数据来源不同导入的方式也是有所不同,下面就来看看具体的操作吧。

1、点击左侧的Repository中的Import Data按钮,该按钮表示导入数据,点击之后会弹出一个窗口,数据来源包括My Computer和Database,我们这里以本地数据为例,选择My Computer按钮。

RapidMiner图片7

2、点击My Computer按钮后选择自己本地的数据,如下图所示:

RapidMiner图片8

3、然后选择next,直到finish(这里注意,本地的数据的列名称不要重复,否则会提示错误)

RapidMiner图片9

4、数据文件导入成功后,在rapidminer工具的Results选项卡中会展示导入的数据,同时会在Repository栏目中展示出导入的文件名称,如下图所示:

RapidMiner图片10

数据预处理

通过数据预处理能够为后续的使用操作提供极大的便利,且能让用户对数据有一个大致的了解,RapidMiner Studio的这个功能可以说是十分实用,这里为大家提供了一份教程来快速了解。

1、新建完流程并成功导入数据文件之后,在rapidminer中选择Design选项卡

2、在Repository栏目中找到导入的数据文件

3、将数据文件拖到process区域中,如下图所示:

RapidMiner图片11

4、分析用户画像数据,发现数据中包含缺省值,所以我们需要将数据中的缺少值进行处理,查看数据中是否有缺省值,如图所示:

RapidMiner图片12

5、根据预先确定好的缺省值,我们在Operators栏目的搜索框中搜索“replace missing values”,即代替缺省值的处理算法模型,如下图所示,将其拖入到Process区域中

RapidMiner图片13

6、将用户画像分析模型out和“replace Missing Values”模型的exa相连线,并与rapidminer的res输出键连线,如图所示:

RapidMiner图片14

7、点击Process区域中的“Replace Missing Values”模型后,通过右侧的Parameters来设置相关参数,如下图所示:

RapidMiner图片15

·attribute filter type:属性的过滤标签,可以针对所有的(all)属性进行操作,也可以按照单个的(single)属性进行处理。

·attribute:用户数据的列名称,即针对具体哪个列进行数据处理。

·default:默认值,比如针对value进行设置

·replenishment value:value对应的值,这里设置为N,意思是我想让所有的缺省值的value都统一设置为N(N代表该用户没有购买倾向)

8、点击执行按钮,看一下效果,如图所示:

RapidMiner图片16

·1处为执行按钮,在第7步的界面下点击执行按钮会出现上图所示的界面效果

·2处为replace missing value后的数据展示

·3处可以明显的看到5行和6行原本的空置被替换成了我们设置的N

9、在之前的步骤上我们尝试对用户画像分析数据进行数据清洗,在Operators中搜素 “filter Examples”模型,并将模型拖动到Process区域中,并将其连线,如图所示:

RapidMiner图片17

10、点击Process区域的filter Examples模型,在Parameters栏中设置过滤清洗的条件,我这里设置的是活跃度>=0.3,如下图所示:

RapidMiner图片18

11、完成条件设置之后,点击OK,然后回到Design,点击执行按钮,出现如图所示界面:

RapidMiner图片19

·用户画像数据由原来的九条数据变成了六条数据,将不符合条件的数据清洗掉了

·保留了活跃度>=0.3的数据

12、在之前的步骤上我们尝试对用户画像分析数据进行数据约减属性处理(即只展示有用的列),在Operators中搜素 “select att”模型,并将模型拖动到Process区域中,并将其连线,如图所示:

RapidMiner图片20

13、点击Process区域的select Attributes模型,在Parameters栏中设置,我这里设置的是subset,然后点击“select Attributes”按钮,选择要保留的列,如下图所示:

RapidMiner图片21

·弹出的窗口会默认展示用户画像分析数据中所有的列名

·我这里将画对勾的通过“→”添加到右侧栏中(即我想要展示的列名),效果如下图:

·然后点击apply按钮

RapidMiner图片22

14、点击完apply按钮后会回到Design界面,然后点击执行按钮看一下效果。如下图:

RapidMiner图片23

·结果页面中只展示了我们想要展示的列

怎么导出数据

1、根据上述步骤完成数据的预处理后,我们现在将处理后的数据进行导出

2、回到Design界面下,在Operators中选择Data Access》Files》Write》write CSV,将write CSV拖在Process中,并将其连线,如下图所示:

RapidMiner图片24

3、单击选中Write CSA模型,在其对应的Parameters中设置相关信息,如下图所示:

RapidMiner图片25

·csv file:导出文件的保存地址

·column separator:分隔符

·write attribute names:是否显示列名称

·quote nominal values:是否显示分隔符

·append to file:在已有的数据基础上新增数据

  • 下载地址
RapidMiner Studio v9.10.0 官方版
下载不了?
相关下载

关于我们 | 免责声明 | 商务洽谈 | 网站地图 | 帮助中心

Copyright © 2014-2022 downxing.com, All Rights Reserved.