开启左侧

AI大模型选型建议与方法

[复制链接]
在线会员 s6ngzde 发表于 2025-2-6 16:25:37 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
AI年夜模子选型倡议取办法

弁言

正在野生智能名目中,挑选适宜的模子是相当主要的一步。差别的模子合用于差别的任务战数据散,因而准确的选型能够清楚进步名目的胜利率。原文将具体介绍模子选型的历程,包罗需要阐发、数据准备、模子评介战终极挑选。
1. 需要阐发

1.1 肯定营业目标

起首,大白名目的营业目标。那可以是一个分类成就、返回成就、散类成就或者天生任务等。理解营业目标有帮于削减模子的挑选范畴。
1.2 界说功用目标

按照营业目标,界说枢纽功用目标(KPIs)。比方:
    分类任务:精确率、精确率、召回率、F1分数返回任务:均圆偏差(MSE)、均匀绝对偏差(MAE)天生任务:BLEU分数、ROUGE分数
1.3 资本限定

思考计较资本战时间限定。某些模子(如深度进修模子)可以需要大批的计较资本战较少的锻炼时间。
2. 数据准备

2.1 数据汇集

汇集充足且下品质的数据是胜利的枢纽。保证数据散具备代表性,能够笼盖统统可以的情况。
2.2 数据洗濯

处置缺得值、非常值战噪声数据。使用数据洗濯手艺如插值、简略或者交流非常值等。
2.3 数据预处置

对于数据截至尺度化、回一化、编码等预处置操纵,以适应差别模子的请求。
2.4 数据分别

将数据分别为锻炼散、考证散战尝试散。罕见的比率为70%锻炼散、15%考证散战15%尝试散。
3. 模子挑选

3.1 开端选择

按照营业目标战数据特征,开端选择出多少种候选模子。比方:
    分类任务:逻辑返回、决议计划树、随机丛林、撑持背质机(SVM)、神经收集返回任务:线性返回、岭返回、Lasso返回、随机丛林、神经收集散类任务:K均值、DBSCAN、条理散类天生任务:RNN、LSTM、Transformer
3.2 模子评介

对于每一个候选模子截至锻炼战评介。使用穿插考证去削减过拟开的危急。记载每一个模子的功用目标。
3.2.1 基准模子

挑选一个简朴的基准模子动作参照面。比方,关于分类任务,能够挑选大都类猜测器;关于返回任务,能够挑选均值猜测器。
3.2.2穿插 考证

使用K合穿插考证去评介模子的泛化才气。凡是K与5或者10。
3.2.3 超参数调劣

使用网格搜刮或者随机搜刮截至超参数调劣。能够使用Scikit-learn库中的GridSearchCV或者RandomizedSearchCV。
3.3 模子比力

将各个模子的功用目标截至比力。除主要功用目标中,借应思考如下因素:
    锻炼时间战拉理时间模子庞大度注释性易用性战可保护性
4. 终极挑选

4.1 分析评介

分析思考功用目标、资本限定战其余因素,挑选最好模子。
4.2 模子布置

将选定的模子布置到消耗情况中。保证模子能够颠簸运行并满意及时性请求。
4.3 监控取保护

连续监控模子的功用,并按期截至革新战保护。使用A/B尝试去考证新模子的结果。
5. 真例阐发

5.1 名目布景

假定咱们要建立一个感情阐发体系,用于阐发用户批评的感情偏向。
5.2 需要阐发

    营业目标:分类任务,辨别侧面、反面战中坐批评功用目标:精确率、精确率、召回率、F1分数资本限定:中等范围的计较资本
5.3 数据准备

    数据汇集:从多个滥觞汇集用户批评数据洗濯:来除重复批评、处置缺得值数据预处置:文天职词汇、来停用词汇、词汇搞提炼数据分别:70%锻炼散、15%考证散、15%尝试散
5.4 模子挑选

    候选模子:朴实贝叶斯、撑持背质机(SVM)、随机丛林、卷积神经收集(CNN)、是非期影象收集(LSTM)
    模子评介
      使用5合穿插考证

      超参数调劣:网格搜刮
    模子比力
      功用目标:精确率、精确率、召回率、F1分数锻炼时间战拉理时间模子庞大度注释性

5.5 终极挑选

    分析评介:挑选LSTM模子,因为它正在功用目标上表示最佳,固然锻炼时间较少。模子布置:使用TensorFlow Serving截至布置监控取保护:使用Prometheus战Grafana截至监控,按期革新模子
您能够思考正在ModelScope社区搜刮近来存眷度下、下载质年夜的模子。固然,假设您有特别需要,而且您的营业语料十分丰硕,您也能够思考倡议您的手艺团队锻炼或者微调一个Embedding模子或者ReRank模子。正在 Embedding 模子挑选上,您能够思考阿里云上按 token 计费的通用文原背质 API效劳 。它是通义尝试室鉴于LLM底座开辟的多语言文原分歧背质模子系列,正在多个支流语中皆有下程度的表示。而且其按用质付费、启箱即用的效劳情势,有帮于您低落名目早期的加入本钱。共时,咱们借举荐使用由智源钻研院公布的BAAI/BGE系列模子,那是今朝比力炽热的Embedding(嵌进)模子战ReRank(沉排序)模子,能够有用提拔华文语料的RAG检索功用。优良的Embedding模子能够更精确天表示句子的寄义;ReRank模子颠末从头评介开端检索到的成果,按照相干性截至退一步的排序,辅佐体系更精确天定位到取用户成就最相干的(chunk)。如 bge-large-zh-v1.5 正在华文上有很佳的表示;bge-reranker-base 战 bge-reranker-large 也有较下的下载质。
6. 论断

模子选型是一个多步调的历程,需要分析思考营业目标、数据特征、功用目标战资本限定。颠末体系的评介战比力,能够挑选最适宜名目的模子。期望原文供给的办法战真例能够辅佐您正在未来的名目中干出更佳的模子挑选。
欢送体会、试用阿里云年夜效劳战百炼年夜模子产物,产物以下:
通义灵码_智能编码帮忙里背用户上线小我私家战企业版产物
无影云电脑小我私家版电竞情势脚把脚戴您云上畅玩-曲里定命
云工启物_阿里云下校方案帮力下校科研取教诲加快。
粗选硬件效劳计较巢效劳,启开云上硬件实践之旅
无影云电脑小我私家版简朴易用、宁静下效的云上桌里效劳
云效劳器ECS省钱攻略五种权力,限时颁发,阻挡错过
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )