SuperCLUE公布2024值得关注的中文大模型全景图，度小满“轩辕大模型”入选

访客 2024-09-04 19:01:46 19087 抢沙发

默认

摘要： 中文大模型产业格局呈现蓬勃发展的态势，领军科技企业创新活跃，产业链不断完善，应用场景日益丰富，正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日，SuperCLUE公布了20...

中文大模型产业格局呈现蓬勃发展的态势，领军科技企业创新活跃，产业链不断完善，应用场景日益丰富，正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日，SuperCLUE公布了2024值得关注的中文大模型全景图，覆盖了金融、医疗、汽车、教育等多个垂类领域中值得关注的中文大模型，度小满“轩辕大模型”成功入选，同时入选的还有百度“文心一言”、腾讯“混元大模型”、阿里“通义千问”等中文大模型。

“轩辕大模型”是度小满在2023年5月开源的国内首个千亿级金融大模型。“轩辕”用度小满实际业务场景积累的海量金融数据训练而来，通过独创的 hybrid-tuning 的创新训练方式，实现在大大增强金融能力的同时，不损失通用能力。自开源以来，已经有上百家金融机构申请试用“轩辕”大模型。2023年9月，度小满开源“轩辕-70B”金融大模型，“轩辕-70B”在C-Eval和 CMMLU两大权威榜单上位列所有开源模型榜首。2023年12月22日，度小满“轩辕”大模型通过《生成式人工智能服务管理暂行办法》备案。

目前，大模型技术已经应用在度小满各个业务场景，从营销、客服、风控、办公再到研发，已经初见成效。在代码助手方面，用大模型辅助生成的代码，采纳率能够达到 42%，帮助公司整体研发效率提升了 20%；在客服领域，大模型推动服务效率提升了 25%。在智能办公领域，大模型目前的意图识别准确率已达到 97%。

SuperCLUE是国内权威通用大模型综合性测评基准，其前身可追溯至第三方中文语言理解评估基准CLUE(The?Chinese?Language?Understanding?Evaluation)。自2019年成立以来，CLUE基准一直致力于提供科学、客观、中立的语言模型评测，其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多个被广泛认可的评估标准。根据CLUE多年测评经验，SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用，构建了多层次、多维度的综合性测评基准。?

标签：模型轩辕