开启左侧

AI大模型前沿系列——如何食用一篇前沿论文(1)

[复制链接]
在线会员 hd7Jjj 发表于 2025-2-9 16:27:39 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
1、步调:

    粗读那篇论文,最少需要读懂80%的实质

    搞懂由哪些模块组成,每一个模块的输出是甚么,输出是甚么?


    跑通论文中的代码

    残破代码包罗四个部门:


      data.py数据

      model.py模子

      train.py锻炼

      utils.py东西类函数

      可选:main.py寄存锻炼参数  test.py复现成果


    以debug的方法读懂80%代码,熟谙每一个参数战每一个操纵先后的shape

    深度进修玩的即是shape,shape能对于应上,模块就可以玩出花女~

    正文分明论文模块的输出战输出shape,就可以疾速匹配自己的模子的代码


2、真战

后绝革新
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )