(3)将视觉模型拓展到一个开放世界(Open World),构建起一个世界模型(World Model),每个个体小模型通过蒸馏的方式与世界模型进行交互学习;
(4)探究视觉模型在长尾分布问题上的解决方案 。
针对以大模型为基础的模型演化,与会专家认为有以下几个值得研究的方向:
(1)在模型参数量(模型容量)固定的情况下,如何让模型容纳更多的信息;
(2)探究使用较少的数据达到与使用全部数据训练相当的性能,即数据集蒸馏;
(3)在模型数据足够大的前提下,设计更好的路径选取方式已适用于特定任务 。
(4)大模型的稀疏优化 。
潘新钢教授认为,(1)方法在大部分情况下是通用的,可以在负担得起的计算资源上验证方法的有效性;(2)有些任务并不依赖大模型,而且并不是所有的问题都要从头开始训练模型;(3)在未来,校企合作可能会成为更广泛的研究方式 。
夏威博士认为,(1)把一些优化算法(如分布式训练、节约显存操作等)集成到研究当中;(2)在模型设计中减少冗余计算 。
高俊博士除了赞同目前还有很多任务不依赖大模型这一观点外,还认为可以把一个大的研究问题分解成多个易于解决的小问题,这些小问题可以用有限的计算资源去解决 。另外一个方面要提升代码的高效性 。
- 揭秘谁是中国历史上封禅泰山次数最多的皇帝?
- 古代皇帝都是学霸!竟然精通多门外语
- 揭曹操与儿媳甄之间宓不能说的秘密
- 芋工房
- 张家界的门票多少钱啊
- 海尚湾畔度假公寓
- 成都热波音乐节
- 米老鼠童装
- 探秘武当山金顶,武当山最值钱的文物很多人不知道,看完就明白了 中国之最武当山
- 超硬核现场!“可以飞的汽车”兴哩很,带你一起体验速度与激情 吉尼斯记录车技表演