knime用三种方法提取列中需要的数据实战

2024-09-06 03:12

本文主要是介绍knime用三种方法提取列中需要的数据实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

有如下数据,需要对数据处理,输出客户需要的效果。

数据样例:👇

图片

最终效果:
图片

01实现过程

第一种解决办法:

详解节点操作过程:

①使用** Table Creator (节点1)**:

  • "Table Creator"节点的作用是允许手动创建数据表,用户可以在类似电子表格的界面中输入数据。
黑龙江省-李四-市场部
广东省-王五-财务部
四川省-赵六-人力资源部
河南省-钱七-研发部
江苏省-孙八-客户服务部
甘肃省-王源-技术组

将上面数据复制到Table Creator中:

图片

②使用** Regex Extractor (节点2)**:

  • "Regex Extractor"节点,用于从文本数据中提取符合指定正则表达式的部分。该节点可以帮助用户从文本中提取特定模式的信息,例如日期、邮政编码、URL等。用户可以在节点配置中指定正则表达式,并将匹配的结果提取到新的列中。这个节点在处理需要从文本中提取特定信息的任务时非常有用

图片

                    正则表达式:([^\-]+)$    或者:(?:.*-)([一-龟]+$)

③最终输出结果如下👇:

图片

第二种解决办法:

在这里插入图片描述

②使用** Regex Substring (节点2)**:

  • "Regex Substring"节点,用于从字符串中提取符合指定正则表达式的子字符串。该节点可以返回子字符串的匹配结果作为新的字符串列,并支持多种返回模式,包括第一个匹配、最后一个匹配、按编号匹配或连接所有匹配。这个节点在需要从文本中提取特定模式的子字符串时非常有用。

图片

③最终输出结果如下👇:

在这里插入图片描述

第三种解决办法:

②使用** Column Expressions (节点2)**:

  • "Column Expressions"是一个节点,用于通过表达式操作列的数据。用户可以在该节点中定义表达式,以对输入数据的列进行计算、转换或创建新列。该节点支持访问列数据、常量和函数,并可以生成新的列作为输出。用户可以使用该节点执行各种列级操作,例如数学运算、逻辑运算、字符串操作等。

图片

③最终输出结果如下👇:

图片

今天的分享就到这里了。有收获的小伙伴,记得点赞、收藏、分享哦!

如果您对本次分享的内容感兴趣的话,记得关注哦!不然下次找不到喽!
关注不迷路哦!

“好记性不如烂笔头”,IT小本本 —— 记录IT知识,分享打工人真实的日常操作笔记!!!
😝有需要的小伙伴,可以V扫描下方二维码免费关注哦!第一时间获取最新动态!!

在这里插入图片描述

这篇关于knime用三种方法提取列中需要的数据实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140838

相关文章

使用python生成固定格式序号的方法详解

《使用python生成固定格式序号的方法详解》这篇文章主要为大家详细介绍了如何使用python生成固定格式序号,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录生成结果验证完整生成代码扩展说明1. 保存到文本文件2. 转换为jsON格式3. 处理特殊序号格式(如带圈数字)4

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

SpringBoot中ResponseEntity的使用方法举例详解

《SpringBoot中ResponseEntity的使用方法举例详解》ResponseEntity是Spring的一个用于表示HTTP响应的全功能对象,它可以包含响应的状态码、头信息及响应体内容,下... 目录一、ResponseEntity概述基本特点:二、ResponseEntity的基本用法1. 创