knime用三种方法提取列中需要的数据实战

2024-09-06 03:12

本文主要是介绍knime用三种方法提取列中需要的数据实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

有如下数据,需要对数据处理,输出客户需要的效果。

数据样例:👇

图片

最终效果:
图片

01实现过程

第一种解决办法:

详解节点操作过程:

①使用** Table Creator (节点1)**:

  • "Table Creator"节点的作用是允许手动创建数据表,用户可以在类似电子表格的界面中输入数据。
黑龙江省-李四-市场部
广东省-王五-财务部
四川省-赵六-人力资源部
河南省-钱七-研发部
江苏省-孙八-客户服务部
甘肃省-王源-技术组

将上面数据复制到Table Creator中:

图片

②使用** Regex Extractor (节点2)**:

  • "Regex Extractor"节点,用于从文本数据中提取符合指定正则表达式的部分。该节点可以帮助用户从文本中提取特定模式的信息,例如日期、邮政编码、URL等。用户可以在节点配置中指定正则表达式,并将匹配的结果提取到新的列中。这个节点在处理需要从文本中提取特定信息的任务时非常有用

图片

                    正则表达式:([^\-]+)$    或者:(?:.*-)([一-龟]+$)

③最终输出结果如下👇:

图片

第二种解决办法:

在这里插入图片描述

②使用** Regex Substring (节点2)**:

  • "Regex Substring"节点,用于从字符串中提取符合指定正则表达式的子字符串。该节点可以返回子字符串的匹配结果作为新的字符串列,并支持多种返回模式,包括第一个匹配、最后一个匹配、按编号匹配或连接所有匹配。这个节点在需要从文本中提取特定模式的子字符串时非常有用。

图片

③最终输出结果如下👇:

在这里插入图片描述

第三种解决办法:

②使用** Column Expressions (节点2)**:

  • "Column Expressions"是一个节点,用于通过表达式操作列的数据。用户可以在该节点中定义表达式,以对输入数据的列进行计算、转换或创建新列。该节点支持访问列数据、常量和函数,并可以生成新的列作为输出。用户可以使用该节点执行各种列级操作,例如数学运算、逻辑运算、字符串操作等。

图片

③最终输出结果如下👇:

图片

今天的分享就到这里了。有收获的小伙伴,记得点赞、收藏、分享哦!

如果您对本次分享的内容感兴趣的话,记得关注哦!不然下次找不到喽!
关注不迷路哦!

“好记性不如烂笔头”,IT小本本 —— 记录IT知识,分享打工人真实的日常操作笔记!!!
😝有需要的小伙伴,可以V扫描下方二维码免费关注哦!第一时间获取最新动态!!

在这里插入图片描述

这篇关于knime用三种方法提取列中需要的数据实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140838

相关文章

CentOS7增加Swap空间的两种方法

《CentOS7增加Swap空间的两种方法》当服务器物理内存不足时,增加Swap空间可以作为虚拟内存使用,帮助系统处理内存压力,本文给大家介绍了CentOS7增加Swap空间的两种方法:创建新的Swa... 目录在Centos 7上增加Swap空间的方法方法一:创建新的Swap文件(推荐)方法二:调整Sww

QT6中绘制UI的两种方法详解与示例代码

《QT6中绘制UI的两种方法详解与示例代码》Qt6提供了两种主要的UI绘制技术:​​QML(QtMeta-ObjectLanguage)​​和​​C++Widgets​​,这两种技术各有优势,适用于不... 目录一、QML 技术详解1.1 QML 简介1.2 QML 的核心概念1.3 QML 示例:简单按钮

基于C#实现MQTT通信实战

《基于C#实现MQTT通信实战》MQTT消息队列遥测传输,在物联网领域应用的很广泛,它是基于Publish/Subscribe模式,具有简单易用,支持QoS,传输效率高的特点,下面我们就来看看C#实现... 目录1、连接主机2、订阅消息3、发布消息MQTT(Message Queueing Telemetr

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

Mysql数据库中数据的操作CRUD详解

《Mysql数据库中数据的操作CRUD详解》:本文主要介绍Mysql数据库中数据的操作(CRUD),详细描述对Mysql数据库中数据的操作(CRUD),包括插入、修改、删除数据,还有查询数据,包括... 目录一、插入数据(insert)1.插入数据的语法2.注意事项二、修改数据(update)1.语法2.有

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

Python日期和时间完全指南与实战

《Python日期和时间完全指南与实战》在软件开发领域,‌日期时间处理‌是贯穿系统设计全生命周期的重要基础能力,本文将深入解析Python日期时间的‌七大核心模块‌,通过‌企业级代码案例‌揭示最佳实践... 目录一、背景与核心价值二、核心模块详解与实战2.1 datetime模块四剑客2.2 时区处理黄金法

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、