AIGC大模型赛场的高校选手们
在中国市场,企业界已经推出了大量的先进模型产品。不过,在这场竞赛中,一个容易被忽视的参赛选手是来自学术界的大学。
多所大学相继开发出自己的大型模型
北京交通大学是其中的一员,与中国计算机学会智慧交通分会以及足智多模公司合作,发布并公开了国内首个综合交通领域的大型模型,命名为TransGPT·致远。这个模型的推出,为智能交通领域的研究和应用提供了重要的支持。
北京大学推出了ChatLaw大模型,哈尔滨工业大学发布了“本草”大模型,复旦大学的“moss”大模型也在研究领域取得了突出成就。清华大学的“chatglm-6B”大模型、上海交通大学研发的“兆言”大模型以及东北大学的“TechGPT”等等,都是国内大学在大型模型研究方面的杰出代表。
苏州大学的一个研发团队最近发布了一款名为OpenBA的开源seq2seq模型。OpenBA是一款具有150亿参数的双语非对称seq2seq模型,也是中国开源模型社区迎来的首个大型语言模型变体。根据相关论文的介绍,研究人员采用了高效的技术,并采用了三阶段的训练策略,从零开始构建了OpenBA模型。
这些国内大学的大型模型不仅在自然语言处理领域有重要应用,还为各个领域的研究和实践提供了有力工具。它们的开源和分享精神也有助于促进科学界和工业界的合作,推动了中国在大型模型研究领域的发展。
国内高校推出的大模型
高校大模型存在商业痛点
通过综合对比,我们发现,高校研发大模型技术产品,跟企业相比,在以下几个方面存在明显的区别:
1、目的不同,高校是为了出学术成果,而不是商业成果。
高校的研究主要追求学术探究,他们致力于探索大模型的理论基础、算法优化以及应用拓展,旨在推动学科发展。研究者追求的是发表高水平论文,提高学术声望,为学术界贡献新知。
相比之下,企业的目标是商业化应用,他们关注的是如何将大模型技术转化为具体的产品和服务,实现商业价值和盈利。
因此,在研发的深度上,高校可能更侧重于技术的原理和探讨,而企业更关心技术的实际应用和商业可行性。
通过综合对比,我们发现,高校研发大模型技术产品,跟企业相比,在以下几个方面存在明显的区别:
1、目的不同,高校是为了出学术成果,而不是商业成果。
高校的研究主要追求学术探究,他们致力于探索大模型的理论基础、算法优化以及应用拓展,旨在推动学科发展。研究者追求的是发表高水平论文,提高学术声望,为学术界贡献新知。
相比之下,企业的目标是商业化应用,他们关注的是如何将大模型技术转化为具体的产品和服务,实现商业价值和盈利。
因此,在研发的深度上,高校可能更侧重于技术的原理和探讨,而企业更关心技术的实际应用和商业可行性。
3、资金实力较弱,算力不足,模型规模较小。
高校在大模型研发中普遍面临着资金实力较弱、算力不足的挑战,这限制了他们在模型规模上的发展。相较之下,企业通常拥有更充足的财力,能够投入大量资源进行研发,尤其是在高昂的算力需求方面。
4、高等院校开发的大型模型产品往往具有较强的实验性质,但在后期持续迭代和改进方面存在明显的不足。
大型模型的研发是一个不断迭代和升级的过程,以适应不断变化的需求和挑战。然而,由于高等院校的研究项目通常以发表学术论文为主要目标,一旦论文发表,后期对模型进行持续迭代和改进的动力和资源支持往往显得不足。这导致许多高等院校推出的大型模型往往只是昙花一现,缺乏持久的影响力和实际应用价值。
需要注意的是,高等院校与企业并不是相互独立的,而是可以紧密合作。
实际上,许多企业正在与高等院校联手进行大型模型技术的研发。此外,企业和高校在人才方面是相互联系的,经常有人才流动。例如,高等院校为企业输送大量人才,是企业进行研发的重要支持力量。另一方面,企业高级人才也可能流动到高等院校进行研发和任教。这样的双向人才流动可以极大地促进人才市场的活跃,而这对于大型模型理论和技术的发展至关重要。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/industry/1018.html