AI界炸了!贾扬清竟用500行代码打造搜索引擎Demo登顶GitHub!你还在觉得构建AI应用难吗?

本文主要是介绍AI界炸了!贾扬清竟用500行代码打造搜索引擎Demo登顶GitHub!你还在觉得构建AI应用难吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

AI大神贾扬清周末狂炫技!仅用500行代码打造的AI搜索引擎Demo就登顶GitHub热榜,告诉世界构建AI应用不过如此。谁说打造AI应用难如登天?贾扬清用实际行动告诉你:天下没有难构建的AI应用!

更多精彩内容关注知乎,都迁移那里:https://www.zhihu.com/people/dlimeng
在这里插入图片描述

AI搜索的三大流派,你知道吗?

如今AI搜索风头正劲,但你知道吗?它们在设计上其实分三大流派哦!

流派一:卡片式展示

像谷歌、百度这样的老大哥,在传统搜索的页面顶部,利用卡片形式来直接给你展示AI生成的答案。简洁明了,一眼就能看明白!

流派二:对话式搜索

必应、百度文心一言则更偏重对话。你可以像和朋友聊天一样,提出问题,AI会帮你总结提炼答案,并在多轮对话中逐步展现。轻松自在,就像有个智能助手在身边!

流派三:新范式代表——Perplexity

还有一类产品,它们遵循的是Perplexity为代表的新范式。搜索结果页面被分为“参考链接-AI回答-相关追问”几个部分,你可以根据需求多轮提问。最厉害的是,搜索结果还有历史记录,可以分享给朋友!而且,Copilot增强模式下,AI还能反向提问,引导你补充搜索条件。个性化提示词功能更是让你随心所欲地调整AI回答的风格和格式!

Perplexity AI是一家成立于2022年8月的公司,总部位于旧金山。其创始人兼首席执行官Aravind Srinivas具有丰富的人工智能背景,曾在OpenAI担任研究科学家。此外,其创始团队还包括Denis Yarats和Johnny Ho等具有人工智能相关背景的人才。Perplexity AI的工作原理是通过理解并重新构建用户查询,从实时索引中提取相关链接,然后利用大语言模型(LLM)阅读链接并整合内容,形成精准答案。

不得不说,Perplexity的模式真的大获成功!就像它的CEO所说,现在这种模式几乎成了行业标准。甚至那些小细节,比如“付费功能的免费使用次数”,都被后来的AI搜索产品学去了!

项目背景与特点

在Lepton Search发布后,Perplexity 的创始人突然出现,质疑其与Perplexity的相似性。
在这里插入图片描述

面对Perplexity AI的挑衅,贾扬清进行了正面回击,强调了LeptonAI在AI开发领域的专业性和优势。他表示,LeptonAI的焦点在于构建一个帮助开发者构建人工智能应用程序的现代云平台,而不是做一个搜索引擎。尽管如此,为了展示LeptonAI的实力和效率,他们还是用手搭建了一个简单的演示工具,并计划将其开源。

在这里插入图片描述

500行代码背后,通过调用已有的基础架构,Lepton Search实现了高效、精准的搜索功能。同时,内置的LLM支持使得搜索引擎能够理解并回答更复杂的问题,提升了用户体验。此外,美观且可分享的UI界面也是这个Demo的一大亮点,让用户在享受技术带来的便捷的同时,也能感受到视觉上的愉悦。

LeptonAI开源项目:https://github.com/leptonai/search_with_lepton

使用环境:https://search.lepton.run/

技术亮点解析

目前,大语言模型主要面临两大挑战:数据陈旧和偶发幻觉。由于预训练数据集具有明确的截止日期,因此无法根据最新数据做出响应。这导致即使是当前最强大的模型,也往往会因数据过时而编造答案,即出现“幻觉”问题。

对于无法访问最新数据的问题,有两种主要的解决方法。第一种是通过搜索引擎执行网络搜索并向大模型提交数据来改善决策质量。Perplexity AI更依赖于这种方法。第二种方法是使用检索增强生成(RAG)技术,这是一种成熟的技术,可以解决一定程度的“幻觉”问题。与动态调用搜索API方法不同,RAG强调从公开数据存储中检索数据。

LeptonAI 基于RAG 技术方式,通过调用已有基础架构的方式构建了一个简单的搜索引擎。

500行代码的AI搜索引擎功能列表

1.大模型,调用了在自家云上部署的开源Mixtral-8x7b模型。
2.搜索引擎,目前用了必应搜索的API。
3.数据存储,用自家Lepton KV作为无服务器存储。
4.对大模型和搜索引擎的接口支持
5.前端UI界面
6.可缓存和可分享的搜索结果

搜索引擎支持与设置

在这里插入图片描述
整个流程是: 用户查询 -> 前端 -> 后端 -> Lepton LLMAPI -> 后端 -> 前端 -> 用户

Lepton Search支持Bing和Google两大搜索引擎,用户可以根据自己的需求进行设置。对于想要快速尝试Demo的用户,还可以使用Lepton Demo API直接体验。在设置搜索引擎API时,用户只需按照相应的指示获取API密钥,并进行简单的配置即可。

部署与应用

Lepton Search的部署过程也异常简单。用户只需在Lepton AI平台上进行一键部署,即可将搜索引擎Demo快速上线。同时,用户还可以根据自己的需求进行自定义配置,如设置部署名称、资源形状等。

一键部署:https://dashboard.lepton.ai/workspace-redirect/explore/detail/search-by-lepton

命令行部署:

lep photon run -n search-with-lepton-modified -m search_with_lepton.py --env BACKEND=BING --env BING_SEARCH_V7_SUBSCRIPTION_KEY=YOUR_BING_SUBSCRIPTION_KEY

总结:

贾扬清通过Lepton Search项目不仅展示了技术实力,更激发了开发者对AI应用的无限期待。
该项目的成功证明了构建AI应用并非遥不可及,而是触手可及的未来。

如果有其他疑问,欢迎朋友关注留言!

我是李孟聊AI,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!

这篇关于AI界炸了!贾扬清竟用500行代码打造搜索引擎Demo登顶GitHub!你还在觉得构建AI应用难吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663436

相关文章

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

Java Spring ApplicationEvent 代码示例解析

《JavaSpringApplicationEvent代码示例解析》本文解析了Spring事件机制,涵盖核心概念(发布-订阅/观察者模式)、代码实现(事件定义、发布、监听)及高级应用(异步处理、... 目录一、Spring 事件机制核心概念1. 事件驱动架构模型2. 核心组件二、代码示例解析1. 事件定义

CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比

《CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比》CSS中的position属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布... css 中的 position 属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布局和层叠关

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Java中Map.Entry()含义及方法使用代码

《Java中Map.Entry()含义及方法使用代码》:本文主要介绍Java中Map.Entry()含义及方法使用的相关资料,Map.Entry是Java中Map的静态内部接口,用于表示键值对,其... 目录前言 Map.Entry作用核心方法常见使用场景1. 遍历 Map 的所有键值对2. 直接修改 Ma

基于Python构建一个高效词汇表

《基于Python构建一个高效词汇表》在自然语言处理(NLP)领域,构建高效的词汇表是文本预处理的关键步骤,本文将解析一个使用Python实现的n-gram词频统计工具,感兴趣的可以了解下... 目录一、项目背景与目标1.1 技术需求1.2 核心技术栈二、核心代码解析2.1 数据处理函数2.2 数据处理流程

github打不开的问题分析及解决

《github打不开的问题分析及解决》:本文主要介绍github打不开的问题分析及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、找到github.com域名解析的ip地址二、找到github.global.ssl.fastly.net网址解析的ip地址三

Python FastMCP构建MCP服务端与客户端的详细步骤

《PythonFastMCP构建MCP服务端与客户端的详细步骤》MCP(Multi-ClientProtocol)是一种用于构建可扩展服务的通信协议框架,本文将使用FastMCP搭建一个支持St... 目录简介环境准备服务端实现(server.py)客户端实现(client.py)运行效果扩展方向常见问题结