ai人工智能面相测试_确定在AI原型中要测试的内容

2023-10-08 11:20

本文主要是介绍ai人工智能面相测试_确定在AI原型中要测试的内容,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ai人工智能面相测试

Deciding what to test is the first, and most important, step in defining an AI prototype. This decision shapes all other decisions in designing the prototype.

确定要测试的内容是定义AI原型的第一步,也是最重要的一步。 该决策将影响设计原型时的所有其他决策。

Defining the hypothesis under test is important because prototypes are messy. And messy experiments give muddled results; hiding the relevant amongst the incidental.

定义被测假设很重要,因为原型很乱。 混乱的实验给出了混乱的结果。 将相关的东西隐藏起来。

Prototypes are broad brush-stroked approximations of the final product. The learnings from a prototype can be game-changing, intriguing, and wholly surprising. But to learn from a prototype with confidence, the effect or insight will need to be large.

原型是最终产品的大致笔触近似值。 从原型中学到的知识可以改变游戏规则,吸引人,并且完全令人惊讶。 但是,要有信心从原型中学习,效果或洞察力将需要很大。

It is very easy to take a finding from a prototype and generalise it, only to later find that the learning was tied directly to some imperfection in the prototype itself. Minor differences between the prototype and end-product can and do impact the learnings. Details such as how fast an element loads, or being constrained to a few user journeys have a very real effect on how the user responds.

从原型中得出发现并进行概括非常容易,后来才发现学习与原型本身的某些缺陷直接相关。 原型和最终产品之间的细微差异可以而且确实会影响学习。 诸如元素加载的速度或受限于几次用户旅程之类的细节对用户的响应方式具有非常真实的影响。

With prototypes, we’re looking for big effects. Things that are obvious once our attention is drawn to them. Not optimisations. For optimisations, do this later in the design process and consider A/B or multi-variate testing on large user groups.

借助原型,我们正在寻找更大的效果。 一旦吸引我们注意,这些事情就显而易见了。 没有优化。 为了进行优化,请在设计过程的后期进行此操作,并考虑对大型用户组进行A / B或多变量测试。

With many elements under test, the feedback will be noisy. It is difficult to untangle the causes and effects of what our users tell and show us.

在测试许多元素的情况下,反馈会很嘈杂。 很难弄清用户告诉我们并告诉我们的原因和结果。

The types of things we might want to test include:

我们可能要测试的事物类型包括:

The technical details

技术细节

  • The performance of the model.

    模型的性能。
  • The speed of delivering the model results.

    交付模型结果的速度。
  • The rate of feedback from a model and whether a user can visibly ‘teach’ the system.

    来自模型的反馈率以及用户是否可以可视地“教”系统。

The interface

介面

  • How interactive is the AI feature.

    AI功能的互动性。
  • Are there separate elements for the AI feature; how are these delineated from the rest of the system.

    AI功能是否有单独的元素? 这些与系统其余部分的区别

The messaging

消息传递

  • Explaining the AI algorithm; what it does and how it learns.

    解释AI算法; 它做什么以及如何学习。
  • Teaching the user how to make the product learn.

    教用户如何使产品学习。
  • How numeric the model results are; how numerate is the user expected to be.

    模型结果的数值如何; 用户期望的数字。
  • Whether and how we communicate error messages.

    我们是否以及如何传达错误消息。

Error correction

纠错

  • How to put fail-safes in place in case of error.

    发生错误时如何设置故障保护。
  • How to determine if the model has broken down.

    如何确定模型是否已损坏。
  • What we do when the model breaks down.

    模型崩溃时我们该怎么做。
  • How to recover from catastrophic error.

    如何从灾难性错误中恢复。
Image for post
simonoregan.com simonoregan.com测试AI原型

Separating these tests is important. For testing the user impact of technical details it is best to have arrived at a finalised design for the interface, messaging and error communication.

分开这些测试很重要。 为了测试用户对技术细节的影响,最好确定接口,消息传递和错误通信的最终设计。

Messaging is closely tied to the interface and error-handling and often won’t be tested alone. Instead, the interface and messaging or the error-handling and messaging will be tested in pairs.

消息传递与接口和错误处理紧密相关,通常不会单独进行测试。 相反,将成对测试接口和消息传递或错误处理和消息传递。

The important thing to bear in mind is that we don’t want to be rapidly swapping these permutations in the hope that we’ll observe fine differences in user responses to help us determine the optimal combination. With small user groups the results will certainly not be statistically significant, nor usually generalisable and relevant.

要记住的重要一点是,我们不想Swift交换这些排列,希望我们会观察到用户响应中的细微差别以帮助我们确定最佳组合。 对于较小的用户组,结果肯定不会具有统计意义,也通常不会具有概括性和相关性。

Instead, choose a configuration with clearly defined upfront assumptions and observe whether the user behaves as expected, and if not, why not.

相反,请选择具有明确定义的前期假设的配置,并观察用户的行为是否符合预期,如果不是,则为什么。

谢谢您阅读🙏🏻 (Thank you for Reading 🙏🏻)

This was originally published on simonoregan.com.

它最初在simonoregan.com上发布 。

If you enjoyed this, you might like The Deployment Age — a weekly update of tools and musings that shine some light on the emerging technologies and trends of the 2020s.

如果喜欢这个,您可能会喜欢“部署时代” -每周更新工具和思路的最新信息,以期了解2020年代的新兴技术和趋势。

翻译自: https://towardsdatascience.com/deciding-what-to-test-in-ai-prototypes-f3988acad62c

ai人工智能面相测试


http://www.taodudu.cc/news/show-7889723.html

相关文章:

  • ai人工智能面相测试_有趣的IQ测试以衡量AI的智能
  • ai人工智能面相测试_全球AI更改笔测试游戏
  • ai人工智能测面相 准吗_AI会对电动蠕变尖叫吗?
  • ai人工智能测面相 准吗_AI中有黑人吗?
  • ai人工智能测面相 准吗_AI会进入法庭吗?
  • 2023年大数据面试通关文牒系列篇
  • CTF—WEB基础篇
  • Scheme详解( web页面判断是否安装某app,并判断是否打开该应用)
  • 初学JAVA项目(二、打砖块)
  • nanodet阅读:(1)概述
  • 软件设计模式与设计原则概述
  • 设计模式概述总览
  • 距离度量概述
  • 前端 概述
  • Android项目开发常用工具类SquareImageView
  • PDF文件太大,如何在线批量压缩
  • 5大手机巨头齐喑:三星再次觊觎中国范本
  • 叉积的证明_向量积分配律的证明
  • 用计算机计算48*13 52*13,(125+60)×8 43×52+43×48用乘法分配律计算
  • 用乘法分配律计算机,4-巧用乘法分配律的几种类型.doc
  • 概率论与数量统计(二)2___随机事件与概率___分配律_对偶律
  • Android手机屏幕到手机间的距离
  • 系统篇:ubuntu 22.04 iptables 运行失败解决方法
  • 【LangChain】自定义chain
  • 【python】itertools.chain类解析
  • 作为前端,工作中处理过什么复杂的需求?
  • 什么才是IT人最有效的学习模式
  • 视频号这么玩一个月内轻松赚到1000+?
  • 推荐一个最全前端学习路线图,请收藏
  • 招股书出错的安能物流:有股东提前退出,1名基石能否顶住局面?
  • 这篇关于ai人工智能面相测试_确定在AI原型中要测试的内容的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



    http://www.chinasem.cn/article/164911

    相关文章

    Python进行word模板内容替换的实现示例

    《Python进行word模板内容替换的实现示例》本文介绍了使用Python自动化处理Word模板文档的常用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录技术背景与需求场景核心工具库介绍1.获取你的word模板内容2.正常文本内容的替换3.表格内容的

    Java+AI驱动实现PDF文件数据提取与解析

    《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

    Java使用正则提取字符串中的内容的详细步骤

    《Java使用正则提取字符串中的内容的详细步骤》:本文主要介绍Java中使用正则表达式提取字符串内容的方法,通过Pattern和Matcher类实现,涵盖编译正则、查找匹配、分组捕获、数字与邮箱提... 目录1. 基础流程2. 关键方法说明3. 常见场景示例场景1:提取所有数字场景2:提取邮箱地址4. 高级

    C#高效实现Word文档内容查找与替换的6种方法

    《C#高效实现Word文档内容查找与替换的6种方法》在日常文档处理工作中,尤其是面对大型Word文档时,手动查找、替换文本往往既耗时又容易出错,本文整理了C#查找与替换Word内容的6种方法,大家可以... 目录环境准备方法一:查找文本并替换为新文本方法二:使用正则表达式查找并替换文本方法三:将文本替换为图

    Linux从文件中提取特定内容的实用技巧分享

    《Linux从文件中提取特定内容的实用技巧分享》在日常数据处理和配置文件管理中,我们经常需要从大型文件中提取特定内容,本文介绍的提取特定行技术正是这些高级操作的基础,以提取含有1的简单需求为例,我们可... 目录引言1、方法一:使用 grep 命令1.1 grep 命令基础1.2 命令详解1.3 高级用法2

    基于Python Playwright进行前端性能测试的脚本实现

    《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

    Spring AI使用tool Calling和MCP的示例详解

    《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

    linux批量替换文件内容的实现方式

    《linux批量替换文件内容的实现方式》本文总结了Linux中批量替换文件内容的几种方法,包括使用sed替换文件夹内所有文件、单个文件内容及逐行字符串,强调使用反引号和绝对路径,并分享个人经验供参考... 目录一、linux批量替换文件内容 二、替换文件内所有匹配的字符串 三、替换每一行中全部str1为st

    从入门到精通详解LangChain加载HTML内容的全攻略

    《从入门到精通详解LangChain加载HTML内容的全攻略》这篇文章主要为大家详细介绍了如何用LangChain优雅地处理HTML内容,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录引言:当大语言模型遇见html一、HTML加载器为什么需要专门的HTML加载器核心加载器对比表二

    三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

    《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn