职贝云数AI新零售门户

标题: AI大模型四大技术架构演进选型 [打印本页]

作者: DQTWNo    时间: 3 天前
标题: AI大模型四大技术架构演进选型
(, 下载次数: 0)


随着人工智能技术的迅猛发展,大模型技术架构也在不断演进和完善。大模型技术架构经过最后的简单交互,逐渐发展为可对已有模型停止才能迁移学习扩展的架构,这个过程包括了四大技术架构的演进,分别为:纯Prompt、Agent + Function Calling、RAG(检索加强生成)和Fine-Tuning(微调技术)。每一种架构都有其独特的特点和运用场景。
1. 纯Prompt:模拟对话的简单交互

纯Prompt技术架构可以看作是最原始、最直观的AI交互方式。它就像与一个人对话,你说一句,AI回应一句,你再继续说,AI再继续回应。这种交互方式的优点在于简单直接,不需求复杂的设置和调用。
(, 下载次数: 0)


核心特性:

运用场景:当你问AI一个成绩,比如“过年去哪玩”,AI会根据你的成绩直接给出一个答案。这种方式适用于简单的对话场景,但在处理复杂义务时能够显得力所能及。
2. Agent + Function Calling:自动发问与功能调用

在Agent + Function Calling架构中,AI不只可以被动回答成绩,还可以自动发问以获取更多信息,并经过功能调用来完成特定义务。例如,你问AI“过年去哪玩”,AI能够会先反问你有几天假期,经过了解更多背景信息来提供更准确的建议。
(, 下载次数: 0)


核心特性:

运用场景:这种架构适用于需求多轮交互和功能执行的复杂场景,比如智能家居控制、客户服务等。AI不只可以了解用户需求,还能自动引导对话和调用详细功能来处理成绩。
3. RAG(检索加强生成):结合向量数据库停止检索

RAG架构结合了Embeddings和向量数据库技术。Embeddings是将文字转换为便于相似度计算的向量编码,这些向量存储在向量数据库中,以便于疾速查找。当接收到一个输入时,AI会根据输入向量在数据库中找到最相似的向量,从而提供相关信息。
(, 下载次数: 0)


核心特性:

运用场景:例如在考试时,看到一道标题,可以经过RAG架构在相关材料中找到对应的内容,并结合标题生成答案。这种方法可以分明提高信息检索的效率和准确性。下面简单引见一下Embeddings如何运用。
嵌入(Embeddings)是机器学习范畴中的一个概念,次要用于将高维的数据转化为低维空间,以便于算法更好地处理和了解数据。嵌入通常用于将团圆的、高维的特征转换为延续的、低维的向量表示。Embeddings典型的运用场景,例如给社群配套的网站添加搜索才能,目前来讲,最好用的模糊搜索就是将内容向量化之后停止搜索,可以做到语义化搜索。
如下面这个例子,输入的是“制造表情包”,出来的结果是“Meme Generator”,结果里没有出现“制造表情包”五个字中的任何一个字,但依然搜索出来了正确的我们需求的结果。
(, 下载次数: 0)


(, 下载次数: 0)


就是由于将内容向量化之后,就可以跨言语停止语义化搜索。那么原理是什么呢?详细如何完成呢?
要将内容向量化,就需求用到 OpenAI 的 Embeddings 接口,文档地址和接口引见网址如下:
  1. https://platform.openai.com/docs/guides/embeddings
  2. https://platform.openai.com/docs/api-reference/embeddings
复制代码
详细运用也很简单,我们假设有100段要被搜索的文字,那么我们每一段文字都调用一次 Embeddings 接口,每调用一次就得到一组向量,100段文字就得到了100组向量。

(, 下载次数: 0)


input 中放入文字,model 目前能用的只要一个,就是 text-embedding-ada-002 ,Embeddings 模型价格也很便宜,23年时opean ai价格是 $0.0001 / 1K tokens ,而且各大AI公司大模型"价格战"如火如荼,全模型矩阵降价。
前往的结果格式如下:
(, 下载次数: 0)


data 数组中的第一个数据里的 embedding 数组就是我们得到的向量数组,这个数组长度是1536,也就是目前 OpenAI 的向量维度是 1536 维。得到向量之后,最简单的我们可以把向量数组存储为一个一个的文本文件,也即是纯文本保存。
更复杂一点的,可以存储到专门的向量数据库里,OpenAI 官方引荐了一些:
1.Chroma:Chroma 是一个开源的嵌入式存储库。它次要用于存储和检索向量嵌入。
2.Elasticsearch:Elasticsearch 是一个非常受欢迎的搜索/分析引擎,同时也是一个向量数据库。它可以用于全文搜索、结构化搜索和分析,并且支持向量数据的存储和相似性搜索。
3.Milvus:Milvus 是为可扩展的相似性搜索而构建的向量数据库。它提供了高效的大规模向量检索才能。
4.Pinecone:Pinecone 是一个完全托管的向量数据库,用户无需关怀底层的维护和管理,可以专注于其运用的开发。
5.Qdrant:Qdrant 是一个向量搜索引擎,专门为高效的向量检索而设计。
6.Redis:虽然 Redis 次要是一个内存数据结构存储,但它也可以作为一个向量数据库来运用,存储和检索向量数据。
7.Typesense:Typesense 是一个疾速的开源向量搜索工具,它提供了简单易用的 API 来停止向量数据的存储和检索。
8.Weaviate:Weaviate 是一个开源的向量搜索引擎,它支持语义搜索和自然言语查询。
9.Zilliz:Zilliz 是一个数据基础设备,由 Milvus 提供支持。它提供了一系列的数据处理方案,包括向量搜索和分析。
这些向量数据库在不同的运用场景中都有其独特的优势,大家可以根据本人的需求选择合适的数据库停止运用。但是不建议一下去还没搞懂原理就用这些向量数据库,可以先直接存为文本文件方式,每次要搜索时,把向量数组载入内存中停止搜索。
搜索第一步,先把用户输入的内容也调用 Embeddings 接口得到一个搜索向量数组,我们命名为向量数组A。
搜索第二步,把一切待搜索的向量数组都载入内存,来一个循环,我们把循环到的每一个待搜索向量数组命名为Bn,第1个就是B0,第2个就是B1,……,第100个就是B99。
用A与B0到B99都停止一次余弦相似度计算,然后得到余弦间隔B0到B99,再从小到大排序,取出前10作为搜索结果,余弦间隔越小表示越相似。
(, 下载次数: 0)


4. Fine-Tuning:深化学习与长期记忆

Fine-Tuning是一种对大模型停止微调的技术,传统的机器学习模型需求经过大量数据停止训练,而Fine-Tuning则应用了在庞大数据集上训练好的大型深度学习模型。用我们本人的了解方式来叙说微调的含义:在原有模型的基础上,经过补充一些数据,用这些补充的数据对原有模型停止训练,训练的过程对原有模型的部分参数停止调整,从而使模型能在某些特定的场景下表现更优。
经过针对特定义务或范畴停止进一步训练,使模型可以长期记住并活学活用这些知识。与后面提到的方法不同,Fine-Tuning可以使AI在特定范畴表现得愈加专业和准确。在预训练模型的基础上停止额外训练,使其顺应特定义务或范畴。这一过程包括选择预训练模型,预备目的义务的数据,调整模型结构,停止微调训练,以及评价和部署。
(, 下载次数: 0)


核心特性:

运用场景:这种技术适用于需求高准确度和专业知识的范畴,如医学诊断、法律咨询等。经过Fine-Tuning,AI可以提供愈加专业、牢靠的建议和服务。
网上关于Fine-Tuning的引见和入门例子还是比较多的,不过大多都是python言语的,github上也有很多学习的开源项目,大家也可以参考一下。
https://github.com/topzcb/starcoder
https://github.com/topzcb/peft
https://github.com/topzcb/fine-tuning
总结

大模型技术架构从纯Prompt的简单对话,到Agent + Function Calling的自动交互,再到RAG的高效检索,最终到Fine-Tuning的深化学习,每一种架构都有其独特的优势和运用场景。了解这些技术架构的特点和适用范围,有助于我们更好地应用人工智能技术来处理实践成绩,提升工作和生活的效率,并推进AI技术的发展和运用。
(, 下载次数: 0)


既然大模型如今这么火热,各行各业都在开发搭建属于本人企业的公有化大模型,那么势必会需求大量大模型人才,同时也会带来大批量的岗位?“俗话说站在风口,猪都能飞起来”可以说大模型这对于我们来说就是一个机会,一个可以改变本身的机会,就看我们能不能抓住了。
严密跟踪科技前沿成果和产业动向,有幸受邀参加微软AI Day,众多业内人士聚集在北京国际饭店宴会厅,在当前经济情势下,或许只要AI有这么大的影响力和热度。
(, 下载次数: 0)


(, 下载次数: 0)


在会上还演示了部分功能,还是挺有特征,避免做广告嫌疑,好用不好用,感兴味的同窗本人试用就知道,反正我也没体验过。

如何学习大模型

如今社会上大模型越来越普及了,曾经有很多人都想往这外面扎,但是却找不到合适的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了有数坑。如今我想把我的阅历和知识分享给你们,协助你们学习AI大模型,可以处理你们学习中的困难。
我已将重要的AI大模型材料包括市面上AI大模型各大白皮书、AGI大模型系统学习道路、AI大模型视频教程、实战学习,等录播视频收费分享出来,需求的小伙伴可以扫取。
(, 下载次数: 0)

一、AGI大模型系统学习道路
很多人学习大模型的时分没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习道路希望可以协助到你们学习AI大模型。
(, 下载次数: 0)


二、AI大模型视频教程
(, 下载次数: 0)


三、AI大模型各大学习书籍
(, 下载次数: 0)


四、AI大模型各大场景实战案例
(, 下载次数: 0)


五、结束语
学习AI大模型是当前科技发展的趋向,它不只可以为我们提供更多的机会和应战,还可以让我们更好地了解和运用人工智能技术。经过学习AI大模型,我们可以深化了解深度学习、神经网络等核心概念,并将其运用于自然言语处理、计算机视觉、语音辨认等范畴。同时,掌握AI大模型还可以为我们的职业发展增添竞争力,成为将来技术范畴的指导者。
再者,学习AI大模型也能为我们本人创造更多的价值,提供更多的岗位以及副业创收,让本人的生活更上一层楼。
因此,学习AI大模型是一项有前景且值得投入的工夫和精神的重要选择。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5