谁才能超过ChatGPT晋升为AI大模型赛道的黑马？

东东 · 发表于 2023-9-14 21:15:36

上面AI从业者说的就是，在榜单上发现了一家且唯一一家大湾区团队，而且一上榜即杀入前八。同属大湾区的其它团队，诸如华为的盘古、腾讯混元模型等均未进入到榜单，可以说这次是大湾区首家大模型团队进入了该权威榜单，并且从评分上超过了ChatGPT 和 Claude-V1.3等实力选手。

GS-LLM-Alpha的开发者为共生矩阵科技（深圳）有限公司。从工商注册信息来看，该公司是2023年5月10日注册的新公司，且无公开融资信息。主创技术团队是前深圳IDEA大模型技术成员，具备全要素大模型自主研发能力。相较于大厂和融资数亿的明星大模型团队，该团队的突然出现成为AI大模型赛道的一个强劲黑马，为本以为格局既定的大模型市场带来更多变数。
到此，值得让人思考的是，为什么这样的团队可以突出重围？实现这样前沿的技术需要什么？

新一代人工智能核心三要素是人、数据与算力。核心中的核心是人：有实际训练与模型研发经验的人。国内进入大模型赛道的玩家主要是两拨人：互联网大厂和具备大模型开发经验的创业团队。前者优势是资本，后者像共生矩阵科技这样的，优势是足够强势的技术人员。

大模型繁荣之下，其实是各种野蛮生长，具备自研能力团队少之又少。就在年初ChatGPT出圈之前，国内仅仅几个团队具备这样的条件专注大模型研发：清华智源/智谱团队、复旦大学Moss团队、深圳IDEA大模型团队，掌握大模型研发技术的核心成员少于100人。在GPT大火之后，互联网大厂快速跟进，但最难解决的是人才。大厂习惯的怼人和怼资源的模式，在研发大模型上体现了超出预期的成本，同时又面临着开源模型和更强的模型出现，那么竞争的意义何在？

以共生矩阵这样初创团队为例，在资源有限的情况下，通过短短数周的准备和训练，就能实现高性能大模型，刷新小规模模型在C-Eval的评分。这足以说明新一代人工智能的竞争将是技术代差的竞争。

同时也简单介绍一下市面上最权威的大模型测评：C-Eval ，覆盖内容广泛，包括STEM、社会科学、人文能力、和其它一些学科，成为大模型全球公认的客观评分标准。
这些指标主要用在以下场景：

评估大型语言模型（LLMs）的知识和推理能力：通过这些指标，可以全面评估LLMs在各个学科领域和不同难度级别的问题上的表现。分析大模型的优缺点：通过这些指标，可以帮助研究人员了解基础模型在哪些领域和问题上表现良好，以及在哪些方面还有待提高。

新一代人工智能将覆盖日常生活与生产全过程，形成一个生态系统。每个智能模型都像森林中的一棵树，互相影响，构成了一个多层次的和谐共生系统。希望共生矩阵科技这样的行业推动者，让人工智能融入日常生活与生产，带来解放、提升幸福。

谁才能超过ChatGPT晋升为AI大模型赛道的黑马？

本帖子中包含更多资源

最佳新人

热心会员

推广达人

宣传达人

突出贡献