谁才能超过ChatGPT晋升为AI大模型赛道的黑马?

[复制链接]
作者: 东东 | 时间: 2023-9-14 21:15:36 |
0 260

37

主题

153

回帖

3694

积分

版主

积分
3694

最佳新人热心会员推广达人宣传达人突出贡献

发表于 2023-9-14 21:15:36| 显示全部楼层 |阅读模式
上面AI从业者说的就是,在榜单上发现了一家且唯一一家大湾区团队,而且一上榜即杀入前八。同属大湾区的其它团队,诸如华为的盘古、腾讯混元模型等均未进入到榜单,可以说这次是大湾区首家大模型团队进入了该权威榜单,并且从评分上超过了ChatGPT 和 Claude-V1.3等实力选手。


GS-LLM-Alpha的开发者为共生矩阵科技(深圳)有限公司。从工商注册信息来看,该公司是2023年5月10日注册的新公司,且无公开融资信息。主创技术团队是前深圳IDEA大模型技术成员,具备全要素大模型自主研发能力。相较于大厂和融资数亿的明星大模型团队,该团队的突然出现成为AI大模型赛道的一个强劲黑马,为本以为格局既定的大模型市场带来更多变数。
到此,值得让人思考的是,为什么这样的团队可以突出重围?实现这样前沿的技术需要什么?


新一代人工智能核心三要素是人、数据与算力。核心中的核心是人:有实际训练与模型研发经验的人。国内进入大模型赛道的玩家主要是两拨人:互联网大厂和具备大模型开发经验的创业团队。前者优势是资本,后者像共生矩阵科技这样的,优势是足够强势的技术人员。


大模型繁荣之下,其实是各种野蛮生长,具备自研能力团队少之又少。就在年初ChatGPT出圈之前,国内仅仅几个团队具备这样的条件专注大模型研发:清华智源/智谱团队、复旦大学Moss团队、深圳IDEA大模型团队,掌握大模型研发技术的核心成员少于100人。在GPT大火之后,互联网大厂快速跟进,但最难解决的是人才。大厂习惯的怼人和怼资源的模式,在研发大模型上体现了超出预期的成本,同时又面临着开源模型和更强的模型出现,那么竞争的意义何在?

以共生矩阵这样初创团队为例,在资源有限的情况下,通过短短数周的准备和训练,就能实现高性能大模型,刷新小规模模型在C-Eval的评分。这足以说明新一代人工智能的竞争将是技术代差的竞争。

同时也简单介绍一下市面上最权威的大模型测评:C-Eval ,覆盖内容广泛,包括STEM、社会科学、人文能力、和其它一些学科,成为大模型全球公认的客观评分标准。
这些指标主要用在以下场景:

评估大型语言模型(LLMs)的知识和推理能力:通过这些指标,可以全面评估LLMs在各个学科领域和不同难度级别的问题上的表现。分析大模型的优缺点:通过这些指标,可以帮助研究人员了解基础模型在哪些领域和问题上表现良好,以及在哪些方面还有待提高。

新一代人工智能将覆盖日常生活与生产全过程,形成一个生态系统。每个智能模型都像森林中的一棵树,互相影响,构成了一个多层次的和谐共生系统。希望共生矩阵科技这样的行业推动者,让人工智能融入日常生活与生产,带来解放、提升幸福。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

24小时热门更多>
快速回复 返回列表 返回顶部