「玩转 TableAgent 数据智能分析」实战数据分析演练

2023-12-13 20:28

本文主要是介绍「玩转 TableAgent 数据智能分析」实战数据分析演练,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

文章目录

    • 前言
    • TableAgent 功能亮点
      • 人人都是数据分析师
      • 融合创新应用的新成果
    • TableAgent 使用介绍
      • 登陆
      • 功能介绍
      • 申请认证
    • 实战数据集分析一
      • 导入 CSV 文件数据
      • 发起提问
      • TableAgent 应答结果
      • 贴切的服务
      • 推荐问题提问
    • 实战数据集分析二
      • 分析结果
      • 分析哪个城市的未来人口最多
    • 总结

TableAgent 可以免费体验,注册后可以免费使用5次,次数使用完了,可以认证申请增加次数(每天15次)
【TableAgent公测地址】

前言

数字化时代,数据分析的重要性犹如空气般无处不在。商业数据分析是数字化管理、智能决策的基础,同时数据分析又是一个专业性极强的工作,描述性分析、诊断性分析、预测性分析,会让大多数只会用 Excel 的人望而生畏。

九章云极 DataCanvas 公司自主研发的 TableAgent 数据分析智能体让大模型对个人生产力的赋能,从写纪要、做总结上升到新的台阶,只要会提问,就能成为一个高级的数据分析师,洞察数据奥秘。

TableAgent 功能亮点

人人都是数据分析师

TableAgent 为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时 TableAgent 也可以满足企业级数据的大规模、高性能分析的要求,这也是 Code Interpreter 目前的短板。

TableAgent 选择了难度更高的代码生成路线,创造性的提出专家模型组的方法来解决这些难题。

融合创新应用的新成果

本次 TableAgent 发布带来的另外一个重要能力是专业化微调,不同行业不同企业在数据分析上有专业的语言背景和分析模型的独特需求,通用的分析工具很难满足专业化的要求,对此 TableAgent 为能够企业提供专业化微调。

TableAgent 为此配套设计了 T+(Table Family)系统,能够高效的实现定制化的微调工作,同时系统具有自我迭代的能力,系统性的体系支撑更高效的实现数据分析各个环节的升级,让用户在无感知的情况下即可获得不断升级的数据分析体验。

TableAgent 使用介绍

进入平台可以看到如下截图,点击立即体验。

登陆

会进入到手机号+验证码登陆页面,如下图:

功能介绍

登陆成功后可以看到页面中分为内容区域和数据集区域。如下图:

用户可以根据自己的需求上传相关数据集文件,目前线上的 TableAgent 版本仅支持 CSV 格式的数据文件。

数据集上传之后,就可以在下方的输入框中录入想要发起的问题。

申请认证

点击页面右上角申请认证按钮,会打开下面页面,只需填写个人信息即可提交申请认证。

登陆成功免费用量是 5 条,申请认证成功之后,15 天之内,每天会有 15 条免费用量。申请认证页面如下:

介绍完基本功能,下面我们就一起实战使用一下。

实战数据集分析一

选择系统提供的样例数据中“Airbnb 民宿价格&评价” 模块。系统自动提供了 CSV 文件。

导入 CSV 文件数据

CSV 文件数据如下:

发起提问

我发起的提问是:我准备全家去东南亚旅行,我每天的预算在 200~500 美元之间,需要 3~6 个床位,目的地是 Thailand 和 Malaysia,去哪更划算呢?帮我画个图比较下性价比哈。

TableAgent 应答结果

TableAgent 针对本次会话耗时 40.8 秒,使用模型alaya 请求消耗 3846 个 Token, 响应消耗 2734 个 Token,共计 6580 个。

回答的结果非常详细,相当满意。

从数据中我们可以看出,Thailand 的平均价格为 255 美元,平均评分为 4.895,而 Malaysia 的平均价格为 315.667 美元,平均评分为 4.97333。这可能意味着在 Thailand 的价格相对较低,但评分相对较高,而 Malaysia 的价格相对较高,但评分也相对较高。

然而,这只是平均值,具体的房源价格和评分可能会因为房源的具体情况(如房源类型、设施、位置等)而有所不同。因此,如果您对价格和评分有特定的要求,建议您在选择房源时,不仅考虑价格和评分,还考虑其他因素,如房源类型、设施、位置等。

总的来说,如果您对价格和评分都有较高的要求,Thailand 可能是一个更好的选择,但如果您对其他因素也有较高的要求,Malaysia 可能是一个更好的选择。

贴切的服务

在问答结束,TableAgent 还基于当前问题提出了接下来可能感兴趣的问题。这样就可以当用户更加方便快捷的获取到自己想要的信息。

TableAgent 提供了 3 个备用问题,分别是:

  1. 哪些房源的折扣价格较低但评价较高,我可以尝试预订这些房源吗?
  2. 哪种类型的房源的价格更稳定,可以帮助我更好的控制预算?
  3. 哪种床型拥有最多的评价?

推荐问题提问

我们选择其中一个问题,接着进行提问。

在详情中列出了详细的流程以及代码,核心内容如下:

Alaya:

  • 计算每种类型房源的价格变动: 首先,从 df 中提取 Price(in dollar)Offer price(in dollar) 两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据 Title 列进行分组,计算每种类型的价格变动的平均值
  • 价格变动最小的房源类型: 从 df_price_diff 中找出 Price_Diff 列最小的行,取出对应的 Title 列的值
# 首先,从df中提取'Price(in dollar)'和'Offer price(in dollar)'两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据'Title'列进行分组,计算每种类型的价格变动的平均值
df['Price_Diff'] = abs(df['Price(in dollar)'] - df['Offer price(in dollar)'])
df_price_diff = df.groupby('Title')['Price_Diff'].mean().reset_index()
# 从df_price_diff中找出'Price_Diff'列最小的行,取出对应的'Title'列的值
min_price_diff_title = df_price_diff.loc[df_price_diff['Price_Diff'].idxmin(), 'Title']

根据数据分析,价格变动最小的房源类型是"{min_price_diff_title}"。这意味着这种类型的房源的价格相对稳定,你可以更容易地根据自己的预算来控制预算。

实战数据集分析二

第二个数据分析,我们选择的方向是“全球大城市人口 2022-2023”,分析人口增长最高是哪个城市?并且对增长率最高的前10名进行画图展示。信息如下图:

分析结果

根据我们的数据分析,人口增长率最高的城市是Lokoja,来自尼日利亚,人口增长率为6.11%。其次是Bujumbura,来自 Burundi,人口增长率为5.93%。第三是Xiongan,来自中国,人口增长率为5.85%。

以下是这些城市的人口增长率的条形图,可以更直观地看到各城市的人口增长情况:

从这些数据中,我们可以看出,尼日利亚的 Lokoja 市的人口增长率最高,达到了 6.11%,其次是 Burundi 的 Bujumbura 市和中国的 Xiongan 市,两人的人口增长率分别为 5.93% 和 5.85%。这四个城市的人口增长率都非常高,这可能意味着这些城市的人口正在快速增长。

然而,值得注意的是,这些数据只是基于当前的数据进行的分析,实际的人口增长可能会受到许多因素的影响,例如经济状况、政策调整等。因此,这些数据只能作为参考,不能完全决定一个城市的人口走势。

分析哪个城市的未来人口最多

根据我们的数据分析,人口增长最快的城市是Delhi。
我们通过计算每个城市的人口增长来得出这个结果。这是基于当前的人口和增长率。具体的数据如下:

CityPop2023growthRate
0Tokyo-78107.6184-0.0021
1Delhi899297.70840.0273
2Shanghai709822.63440.0243
3Dhaka754312.52000.0325
4Sao Paulo192267.75600.0085
5MexicoCity198304.8338
6Cairo441445.6800 0.0199
7Beijing441854.14420.0203
8Mumbai340744.25600.0160
9Osaka-45632.2416-0.0024

这个表格显示了每个城市的预计 2023 年人口。你可以看到,Delhi 的预计人口增长率最高,这意味着这个城市的人口将在未来几年中迅速增长。

请注意,这个预测是基于当前的人口和增长率,并且可能会有所变动。因为人口增长受到许多因素的影响,包括但不限于经济状况、政策、自然灾害等。因此,这个结果应被视为一种可能的预测,而不是绝对的确定。

总结

TableAgent,由九章云极 DataCanvas 自主研发,为企业提供私有化部署,安全高效。以代码生成为基础,让每个人都能成为高级数据分析师,轻松应对描述性、诊断性和预测性分析。其专业化微调和 T+ 系统满足不同行业的独特需求。

通过实战数据集分析,展示了 TableAgent 强大的数据分析能力。从 Airbnb 民宿价格比较到全球大城市人口增长,TableAgent 提供了直观详细的结果。用户友好的界面、方便的上传功能以及贴切的推荐问题服务使其在数据分析领域脱颖而出。

总体而言,TableAgent 是数字化时代数据分析的得力助手,将复杂的数据分析变得简单易行。

这篇关于「玩转 TableAgent 数据智能分析」实战数据分析演练的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/489847

相关文章

Mysql数据库中数据的操作CRUD详解

《Mysql数据库中数据的操作CRUD详解》:本文主要介绍Mysql数据库中数据的操作(CRUD),详细描述对Mysql数据库中数据的操作(CRUD),包括插入、修改、删除数据,还有查询数据,包括... 目录一、插入数据(insert)1.插入数据的语法2.注意事项二、修改数据(update)1.语法2.有

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

Python日期和时间完全指南与实战

《Python日期和时间完全指南与实战》在软件开发领域,‌日期时间处理‌是贯穿系统设计全生命周期的重要基础能力,本文将深入解析Python日期时间的‌七大核心模块‌,通过‌企业级代码案例‌揭示最佳实践... 目录一、背景与核心价值二、核心模块详解与实战2.1 datetime模块四剑客2.2 时区处理黄金法

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

Spring Boot集成Logback终极指南之从基础到高级配置实战指南

《SpringBoot集成Logback终极指南之从基础到高级配置实战指南》Logback是一个可靠、通用且快速的Java日志框架,作为Log4j的继承者,由Log4j创始人设计,:本文主要介绍... 目录一、Logback简介与Spring Boot集成基础1.1 Logback是什么?1.2 Sprin

PostgreSQL 序列(Sequence) 与 Oracle 序列对比差异分析

《PostgreSQL序列(Sequence)与Oracle序列对比差异分析》PostgreSQL和Oracle都提供了序列(Sequence)功能,但在实现细节和使用方式上存在一些重要差异,... 目录PostgreSQL 序列(Sequence) 与 oracle 序列对比一 基本语法对比1.1 创建序

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

Spring Validation中9个数据校验工具使用指南

《SpringValidation中9个数据校验工具使用指南》SpringValidation作为Spring生态系统的重要组成部分,提供了一套强大而灵活的数据校验机制,本文给大家介绍了Spring... 目录1. Bean Validation基础注解常用注解示例在控制器中应用2. 自定义约束验证器定义自