在2年前,OpenAI搞了一个1750亿个参数的神经网络模型 即GPT-3(是它的前辈GPT-2 约15亿个参数 的100多倍)。可惜的是 GPT-3并没有开源它预训练的参数数据集,使用者只能调用他们提供的API,由于这个API必须要申请,所以我还没机会用到。不过,已经有很多公司基于GPT-3开发了一些应用,比如说GitHub就开放一个GitHub Copilot用于智能补全代码,大家感兴趣的可以去试试。 通常而言,GPT-3这种级别的神经网络模型只有OpenAI 谷歌这种巨头科技公司能够开发和训练,毕竟1750个参数可不是一个小数目。但是,一个由约1000多个学术志愿者组成的国际志愿者不信邪,他们正在用价值700万美元的公共资金赞助的计算时间去训练一个具有1760亿个参数的自然语言模型,BLOOM。 出于兴趣爱好,我在自己的Macbook Pro上测试了这个BLOOM-1b3模型,顾名思义就是该模型有13亿参数。为什么不测试完整的1750亿个参数呢?因为光读取13亿参数到Python中,就需要占用6G左右的内存,完整的1750亿个参数,起码得是一个1T内存的服务器才行。而且完整参数版还没有完工,仍在训练中。 可惜我的能力有限,对BLOOM的探索就止步于此了,等到后续我对Transformers有更多的掌握后,再更新相关的内容吧。 参考资料 - [URL]
在2年前,openai搞了一个1750亿个参数的神经网络模型
相关链接
- 欧式起重机的基本参数是设计的依据基础,必须符合相关标准
- 全局参数是在当前报表工程下创建的参数
- 当mpstat不带参数时,输出为从系统启动以来的平均值
- 我们在调用函数的时候没有传递参数,那么就默认使用 l=[]
- 我常强调,调了唱臂的任何一个参数,其它参数一定会受到影响
- css3有个transform
- bm直流电流信号隔离器可以对电流、电压等电量参数或温度、电阻
- 伴随着信息技术和计算机技术的不断发展
- 直接在${}或{}中填入从0开始的数字
- time函数的使用方法: 功能说明:返回具体时间的序列号
- 应用范围 产品开发于21世纪初叶
- versus 的网站号称“万物皆可对比”
- 简要描述:bm系列模拟信号隔离器可以对电流、电压等电量参数或
- 简要描述:壁挂式多参数水质分析仪是本公司自主研发的新一代智能
- 在访问一个数组实例的元素时
- 简要描述:ph,余氯,浊度一体式多参数分析仪为智能环保物联网
- 简要描述:thz-c台式恒温振荡器广泛应用于对温度、振荡频率
- macd是一个常用的技术指标
- 水质分析仪多参数和单参数的选择哪种更好
- 一种温度恒定的特殊环境测试仪器——恒温箱
- 简要描述:ss102k齿轮测速传感器,是用于测量速度的器件
- 您是否有兴趣增强参数能力,将您的设计技巧提升到更高的水准
- 简要描述:安科瑞bm-di/ii一进二出模拟信号隔离器可以对
- 电参数测量仪是电力行业中非常重要的一种测试设备
- 在学习#和##之前,先来看一个关于"的例子: 输出为: 查看
- 一般函数的参数个数都是固定的
- hach水质参数分析仪是款新型多参数、宽量程的水质分析仪器
- openapi 规范旧称为 swagger定义了一个 res
- 在多个方法中经常遇到相同的参数组
- 在端到端视频单播结构中结合实时传输协议rtp的特性设计了一种