收藏 分销(赏)

KNIME-quickstart.docx

上传人:仙人****88 文档编号:11959112 上传时间:2025-08-22 格式:DOCX 页数:19 大小:740.02KB 下载积分:10 金币
下载 相关 举报
KNIME-quickstart.docx_第1页
第1页 / 共19页
KNIME-quickstart.docx_第2页
第2页 / 共19页


点击查看更多>>
资源描述
knime快速入门 安装: 下载软件,解压到指定目录中,单击knime.exe文件启动KNIME。 欢迎界面/附加特色: 首次KNIME启动后,出现欢迎屏幕,可看到: 1、打开KNIME工作台:打开KNIME工作台立即启动KNIME,建立工作流,探索数据。 2、获得附加节点:除了准备启动基本KNIME安装,还有附加的KNIME插件(plug-ins)。如R和Weka集成,或附加的处理化学结构、化合物的化学工具包等等。可下载这些特色也可从KNIME内部更新(文件,更新KNIME……)。 一、工作界面预览: KNIME工作台如下图所示: 二、操作步骤: 1、建立工作流:Building a workflow 将节点从节点资源库拖到工作流编辑器并连接它们来构建工作流。 节点是工作流的基本处理单元。每个节点具有多个输入和/或输出端口。 数据(或模型)通过连接从输出端口传输到另一个节点的输入端口。 节点状态:Node Status 当节点被拖动到工作流编辑器上时,状态指示灯显示红色,意味着必须配置节点以便能够执行。 通过右键单击节点,选择“配置”,然后在节点的对话框中调整必要的设置来配置节点。 当通过按下“确定”按钮关闭对话框时,将配置节点,并且状态指示灯变为黄色:节点已准备好执行。 右键单击节点,再次显示启用的“执行”选项; 按下它将执行该节点,并且该节点的结果将在输出端口可用。 成功执行后,节点的稳态灯为绿色。 可通过浏览输出端视图来检查结果:在上下文菜单中的最后一个条目打开它们。 端口 左侧的端口是输入端口,提供来自前续节点的输出端口的数据。 右边的端口是输出端口。 节点对数据的操作结果在输出端口提供给后续节点。 工具提示提供了有关节点输出的信息,更多信息可以在节点描述中找到。 节点被键入,使得仅可以连接相同类型的端口。 数据端口:最常见类型是从节点到节点传输平面数据表的数据端口(白色三角形)。 数据库端口:在数据库中执行命令的节点可以由其数据库端口识别(棕色方块): PMML端口:通过蓝色平方PMML端口,数据挖掘节点学习传递到参考预测器节点的模型。, 其它端口:每当节点提供不适合平面数据表结构的数据时,使用通用端口(深蓝色方形)用于结构化的数据。 既不是数据、数据库、PMML或结构化数据的端口的端口显示为“未知”类型(灰色方块)。 示例流程 现一步一步介绍构建一个简单小型工作流程:从ASCII文件读取数据,为其分配颜色,聚类数据,在表格和散点图中显示数据。 在执行流程后,将检查已经构建的数据模型。 假设刚刚启动KNIME建立一个空的工作流。 添加节点(Adding Nodes): 在节点资源库中,展开“IO”和包含的“读取”类别,如下所示(左图),拖曳文件读取器图标到工作流编辑器窗口中。 现在下一个节点将是K均值聚类算法。 展开挖掘类别,然后是聚类类别,然后将K-Means节点拖动到流(右图)。 在节点资源库搜索框中输入“color”,然后按“Enter”。 这会将显示的节点限制为名称中带有“color”的节点(参见上图中间)。 将颜色管理器节点拖到工作流上(此节点将稍后定义数据视图中的颜色)。 再次查看存储库中的所有节点,请在节点资源库的搜索字段中按ESC或退格。 现在将“交互表”和“散点图”从“数据视图”类别拖动到“工作流程编辑器”,并将其放置在“颜色管理器”节点的右侧。 连接节点(Connecting Nodes): 现在需要连接节点以便获得数据流。单击输出端口并将连接拖动到相应的输入端口。 完成流程如下图所示: 当然,节点不会显示绿色状态,只要它们没有配置和执行。 配置节点(Configuring Nodes): 完全连接需要配置显示红色状态图标的节点。从文件读取器开始,右键单击并从菜单中选择“配置”。 浏览到KNIME安装目录中的“IrisDataSet”目录。从此位置选择data.all文件。文件读取器的预览表显示了数据的样本。 按确定关闭文件读取器节点的对话框。 一旦节点配置正确,它将切换到黄色(表示准备执行)。 之后,K-Means节点将立即变为黄色,因为将应用其默认设置。可以确认默认设置符合您的需要,打开对话框并检查默认设置。 为了配置颜色管理器节点,您必须首先执行K-Means节点。执行后,所有属性的所有标称值和范围都是已知的:此元信息传播到后续节点。颜色管理器需要此数据才能进行配置。 一旦执行K-Means节点,打开颜色管理器节点的配置对话框。 执行节点(Executing Nodes): 现在执行散点图节点:工作台将为您执行所有前续节点。 在更大、更复杂的流程中,您可以选择多个节点并触发所有节点的执行。工作流管理器将根据需要执行节点,如果可能并行执行。 检查结果(Inspecting the Results): 为了检查数据和结果,打开节点视图。 在示例中,K均值,交互式表和散点图有视图。从节点突出显示中打开它们。 高亮标记(Hiliting): 在散点图中选择一些点,然后从“高亮Hilite”菜单中选择“高亮选择Hilite Selected”。 被高亮的点用橙色边框标记。 您还将在表视图中看到被高亮的点。高亮状态的传播适用于显示相同数据流所有分支中的所有视图。 踏上你自己的探索之旅! 现在这只是一个很简单开始的例子,还有很多值得探索的地方。 玩吧!保持简单和直观。很乐意收到您的反馈,找出您喜欢什么和您不喜欢什么;觉得尴尬的东西或似乎没有工作的东西。 KNIME工作台指南(KNIME Workbench User Guide) 可用视图说明(Description of Available Views) 下文中详细地描述KNIME工作台及其特征。 当KNIME最初打开时,它从以下视图的排列开始: 工作流项目(Workflow Projects): 所有KNIME工作流均显示在“工作流项目”视图中。工作流的状态指示工作流是关闭、空闲的、正在执行还是是否执行完成。 收藏节点(Favorite Nodes): “收藏节点”视图显示最喜欢、最常用和最后使用的节点。 通过将节点从节点库拖动到个人收藏节点类别,可将节点添加到收藏夹。 每当将节点拖动到工作流编辑器上时,将更新最后使用和最常用的类别。 收藏节点视图在视图的菜单栏中包含以下操作: 折叠所有展开的类别 展开所有类别 清除最后使用和最常用的类别 从收藏夹中删除所选节点 最频繁和最后使用类别中的节点数量默认限制为十个节点。 此数可以在首选项中进行调整。 选择“File/Preferences..”/ KNIME / KNIME GUI为常用节点的最大大小和最后使用的节点的最大数量设置不同的值。 节点资源库(Node Repository): 节点存储库包含按类别排序的所有KNIME节点。类别可以包含另一个类别,例如,“读取”类别是IO类别的子类别。 将节点拖曳到工作流编辑器中,可以将资源库中的节点添加到工作流编辑器。 选择类别显示节点描述视图中的所有包含的节点; 选择节点将显示此节点的帮助。 如果知道节点的名称,可在节点资源库的搜索框中输入名称的部分。 在键入时,所有节点将立即过滤到包含其名称中输入的文本的节点: 大纲(Outline): 大纲视图提供了整个工作流的概览,即使工作流编辑器中有一小部分可见(在大纲视图中标记为灰色)。 大纲视图可用于导航:灰色矩形可以用鼠标移动,导致编辑器滚动,使可见部分与灰色矩形匹配。 控制台(Console): 控制台视图打印出错误和警告信息,便为您提供在引擎提示下发生的事情线索。 相同的信息(具有调试DEBUG详细信息级别写入日志文件,位于{workspace} /。metadata / knime / knime.log)。 如果要更改详细程度(日志文件或控制台视图级别),请转到文件/首选项... / KNIME用于日志文件的详细级别或文件/首选项... / KNIME / KNIME GUI的控制台视图的详细级别。</ p> 可选择: 调试:调试消息主要用于开发。 不建议将其用于控制台视图,因为它会减慢KNIME。 信息:记录信息消息。 不是真的重要,但也不是完全无用! 警告:如果节点配置失败,也会发出警告消息。 警告消息不是致命的; 通常工作流可以继续执行,但它们表示已经发生了值得了解的事情。 默认和建议级别控制台视图。 错误:仅在发生致命事件时发出,即工作流程无法再执行。 节点描述(Node Description): 节点描述显示关于所选节点(或所选类别中包含节点)的信息。 特别地,它解释了对话框选项、可用视图、预期输入数据和结果输出数据。 Linux下,此视图有一些问题,因为它需要系统的Web浏览器。 “如果环境变量MOZILLA_FIVE_HOME未设置,KNIME / Eclipse会尝试自动查找基于Mozilla的浏览器。 knime.sh应该注意在这种情况下使用哪个浏览器。可以尝试显式设置MOZILLA_FIVE_HOME到firefox目录,如果这不能帮助你也可以尝试传递“-Dorg.eclipse.swt.browser.XULRunnerPath = ...”到knime.sh。 有一个已知的Firefox 3(和xulrunner> = 1.9)的问题,除了使用旧版本,没有解决方法。这也可能会导致一些麻烦。“另请参阅链接的Eclipse错误报告https://bugs.eclipse.org/bugs/show_bug.cgi?id=236724。 为了提供全文搜索,节点描述也集成在Eclipse帮助中。 从菜单中选择帮助/帮助内容以打开Eclipse内置帮助。 有一个KNIME类别,它有一个节点描述子菜单。 在搜索字段中,可以对所有节点描述执行全文搜索。 例如,如果键入“cluster”,将显示包含单词cluster的所有节点描述: 首选项(Preferences): 首选项使用文件/首选项...打开。KNIME相关首选项分为三类: KNIME首选项也可应用到KNIME批处理模式。 -日志文件记录层级(Log file Log Level):日志文件的详细程度。 默认值为DEBUG,这意味着还会记录开发人员的信息。 如果您遇到任何意外行为,则将此日志文件发送给我们可能会给我们提示导致该问题的原因。 -所有节点的最大工作线程数(Maximum working threads for all nodes):KNIME工作流管理器尝试优化所有节点的执行时间,例如,通过将工作流的单独分支分布到多个线程。 它可以归结为并行的运行节点尽可能。 在这里你可以输入应该用于并行化的线程数。 默认情况下,它是CPU数量的两倍。 这已被证明是一个很好的数值。 -临时文件目录(Directory for temporary files):KNIME需要在某处存储一些临时文件(已执行但尚未保存的工作流的数据)。 这是您可以指定位置的位置。 KNIME图形用户界面(KNIME GUI): KNIME图形用户界面相关首选项。 -控制台视图日志级别(Console View Log Level):详细程度的日志消息控制台视图中显示。 通常警告就够了。 DEBUG会降低性能,并且主要用于开发。 -确认节点复位(Confirm Node Reset):在重置已执行的节点时选中或取消选中是否要弹出确认对话框。 如果您在此类型的对话框中选中了“不要再询问”复选框,请转到首选项以使其重新出现。 -确认节点/连接删除(Confirm Node/Connection Deletion):与上述相同,但用于确认删除节点和/或连接。 -确认已连接的节点的重新连接(Confirm reconnection of already connected nodes):从KNIME 2.0起,可以将连接拖动到已连接的端口。 如果已配置节点,则会替换连接,但如果已执行该连接(因此将通过更换连接进行重置),将显示确认对话框。 此确认对话框也可以通过此首选项打开或关闭。 -最常用节点的最大数(Maximum size for most frequently used nodes):由“收藏节点”视图的最常用节点类别维护的节点数。 -最后使用节点的最大数(Maximum size of last used nodes):由“收藏节点”视图的最后用节点类别维护的节点数。 主密钥(Master Key) KNIME不在简单测试中存储任何密码(例如,对数据库),但使用主密钥加密它们。 工作流编辑器(Workflow Editor): 工作流编辑器用于组合工作流,配置和执行节点,检查结果和探索数据。 本节介绍在编辑器内互动可能。 节点选项(Node Options): 配置(Node Options): 当节点被拖动到工作流编辑器或连接时,它通常显示红色状态指示其需要被配置,即,对话必须被打开。这可以通过双击节点或右键单击节点以打开上下文菜单来完成。上下文菜单的第一个条目是“配置”,打开对话框。 如果选择了节点,您还可以从编辑器上方的工具栏中选择相关按钮。 该按钮看起来像上下文菜单条目旁边的图标。 执行(Execute): 在下一步中,您可能想要执行该节点,即您希望该节点实际上对数据执行其任务。要实现这一点,右键单击节点以打开上下文菜单并选择“执行Execute”。 您也可以从工具栏中选择相关按钮。 该按钮看起来像上下文菜单条目旁边的图标。 没有必要执行每个单节点:如果执行连接的最后一个节点但尚未执行的节点,则所有前续节点将在执行最后一个节点之前执行。 执行全体(Execute All): 在编辑器上方工具栏中,还有一个按钮来执行工作流上所有尚未执行的节点。 如果由于前续节点中缺少信息而导致流中的节点亮起红色状态指示灯,则这也会起作用。 当执行前续节点并且具有红色状态指示灯的节点可以应用其设置时,它将被执行以及它的后继。 底层工作流管理器还尝试并行执行工作流的分支。 执行和打开视图(Execute and Open View): 节点上下文菜单还包含“执行并打开视图”选项。 这将执行节点并立即打开视图。 如果节点有多个视图,则只打开第一个视图。 打开视图(Open View): 节点可以没有一个或多个视图。 每个视图在节点的上下文菜单中显示为一个条目。 选择它以便打开相关视图。 在执行节点之前打开视图会在节点执行后立即更新。 您可以打开一个节点的视图多次,例如。 如果您想要比较散点图中的不同列。 如果节点被复位,视图将自动复位。 打开输出端口视图(Open Out-port View): 如果节点没有视图,但您对节点对数据的操作结果感兴趣,则可以检查数据。它在节点的输出端口可用。在上下文菜单的底部,对于节点的每个输出端都有一个条目,每一个打开参考出端口视图。注意,出端口视图不支持任何交互或高亮hiliting。 如果要高亮hilite数据或查看hilited数据,您必须将输出端口连接到交互数据表(Interactive Table)节点。 复位(Reset): 您可以通过从上下文菜单中选择重置选项来重置节点。节点从执行状态(绿色状态指示灯)返回到配置状态(黄色状态指示灯)。 如果选择了节点,您还可以从编辑器上方的工具栏中选择相关按钮。 该按钮看起来像上下文菜单条目旁边的图标。 取消(Cancel): 如果节点当前正在执行,可以通过从上下文菜单中选择“取消”选项或从工具栏中选择相关按钮(与上下文菜单中的图标相同)来取消执行。 取消全部(Cancel All): 工具栏还包含一个“取消所有”按钮,取消所有正在运行的节点的执行。 输入自定义节点名称(Enter Custom Node Name): 当节点被拖动到工作流时,它在状态灯下面默认具有诸如“节点1”或类似的名称。 您可以更改此名称,以更好地描述节点实际执行的操作,例如。 “过滤器值> 10”。 这可以通过选择节点,然后单击名称来完成:名称变为可编辑。按“返回”应用您的更改。 输入自定义节点描述(Enter Custom Node Description): 在上下文菜单中,还将找到“节点名称和描述”选项。 选择此项将打开一个对话框,为节点输入新名称。 此外,您可以输入更详细的描述或关于节点的注释。 此操作也可通过工具栏中的按钮使用。 连接(Connections): 您可以通过将鼠标从一个节点的输出端口拖动到另一个节点的输入端口来连接两个节点。 不允许循环。 如果节点已经连接,您可以通过拖动新连接到其上来替换现有连接。 如果节点已经连接,您将被要求确认目标节点的结果复位。 您还可以将现有连接的末端拖动到新的入端口(同一节点或不同节点)。 导入/输出工作流(Import/Export of workflows): 导入工作流(Import workflows): 您可以从其他工作区或zip文件导入工作流,例如 如果工作流是从KNIME导出的。 可从菜单“文件/导入KNIME工作流...”或通过打开工作流项目视图中的上下文菜单并选择“导入KNIME工作流...”来打开导入向导。 如果要从其他工作区导入工作流,请选择根目录。 如果要浏览到压缩的工作流,请选择存档文件选项,选择要导入的工作流。 如果当前工作空间中已存在具有相同名称的工作流,则可以在向导的下一页重命名导入的工作流。 单击“确定”,项目将导入到您的工作区。 如果取消选中“将项目复制到工作区”,对该工作流的更改也将应用于源位置中的工作流。 导出工作流(Export of workflows): 也可以通过菜单(文件/导出KNIME工作流...)或通过工作流项目视图的上下文菜单使用导出工作流操作。打开导出工作流向导选择要导出的工作流。如果您鼠标右击工作流以打开预先选择此工作流导出向导,在第二个字段中浏览到目标位置或输入导向导出位置的路径。 默认情况下,将排除导出数据的选项激活。 如果选中,则只导出工作流的结构,这将导致配置但未执行的工作流(如果已重新导入)。 如果明确共享数据(例如,如果其他人无权访问数据库),则可以取消选中此选项。 使用元节点(Using Meta Nodes): 元节点是包含子工作流的节点,即在工作流中它们看起来像单个节点,尽管它们可以包含许多节点和甚至更多的元节点。 它们是在元节点向导的帮助下创建的。 您可以通过选择“节点/添加元节点” 从菜单打开元节点向导,或通过单击工具栏中元节点图标的按钮(工作流程编辑器必须处于活动状态)。 建立预定义元节点(Create Pre-defined Meta Node): 要创建预定义的元节点,请选择一个,然后单击“完成”, 您选择的一个添加到工作流。 建立自定义元节点(Create Customized Meta Node): 如果您需要不同数量的输入或输出端口或想要有不同的端口类型,您可以选择一个预定义的元节点作为模板,然后单击“自定义”访问向导的下一页。 在此页面上,您可以添加或删除模板的入和出端口。 底部的图标会立即给出节点的预览。 当您向模板添加端口时,可以选择端口的类型: -数据, -数据库,或 -数据挖掘端口(PMML)。 在元节点内(Inside a Meta Node): 要打开元节点,您可以双击它,或从其上下文菜单中选择“打开子工作流编辑器”。 根据输入和输出端口的数量,元节点的内部看起来类似于下面的图片: 入口或出口固定到所谓的工作流程端口栏,可以移动和调整大小。 从外部连接到入站端口的数据显示在入站端口的元节点编辑器中。 反之亦然:连接到内部输出端口的数据出现在外部输出端口中。 来自外部的元节点(Meta Nodes From Outside): 元节点看起来不同于正常节点。 背景图标不是圆角,并且具有深灰色背景。 没有状态灯,没有进度。 元节点的状态(States of Meta Nodes): 元节点不具有与节点一样多状态。 元节点的状态与工作流的状态相同。 元节点可以是: -闲置/配置(idle/configured):如果元节点内至少有一个节点既不已执行也不执行中。 -执行中(executing):如果至少有一个节点正在执行 -已执行(executed):如果包含的节点已经执行 元节点输出端口(Out-Ports of Meta Nodes): 除了元节点的状态之外,元节点的输出端口也具有状态。小的装饰器图标显示出端口的状态。 如果端口未连接或连接到空闲节点,则规格和数据都不可用。 这由红色图标指示。 如果端口连接到配置的节点,某些规格可用。 这由黄色图标指示。 如果端口连接到执行的节点,则规范和数据可用。 这由绿色图标指示。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服