本文作者:访客

SuperCLUE公布2024值得关注的中文大模型全景图,度小满“轩辕大模型”入选

访客 2024-09-04 19:01:46 19087 抢沙发
SuperCLUE公布2024值得关注的中文大模型全景图,度小满“轩辕大模型”入选摘要: 中文大模型产业格局呈现蓬勃发展的态势,领军科技企业创新活跃,产业链不断完善,应用场景日益丰富,正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日,SuperCLUE公布了20...

SuperCLUE公布2024值得关注的中文大模型全景图,度小满“轩辕大模型”入选

中文大模型产业格局呈现蓬勃发展的态势,领军科技企业创新活跃,产业链不断完善,应用场景日益丰富,正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日,SuperCLUE公布了2024值得关注的中文大模型全景图,覆盖了金融、医疗、汽车、教育等多个垂类领域中值得关注的中文大模型,度小满“轩辕大模型”成功入选,同时入选的还有百度“文心一言”、腾讯“混元大模型”、阿里“通义千问”等中文大模型。

“轩辕大模型”是度小满在2023年5月开源的国内首个千亿级金融大模型。“轩辕”用度小满实际业务场景积累的海量金融数据训练而来,通过独创的 hybrid-tuning 的创新训练方式,实现在大大增强金融能力的同时,不损失通用能力。自开源以来,已经有上百家金融机构申请试用“轩辕”大模型。2023年9月,度小满开源“轩辕-70B”金融大模型,“轩辕-70B”在C-Eval和 CMMLU两大权威榜单上位列所有开源模型榜首。2023年12月22日,度小满“轩辕”大模型通过《生成式人工智能服务管理暂行办法》备案。

目前,大模型技术已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到 42%,帮助公司整体研发效率提升了 20%;在客服领域,大模型推动服务效率提升了 25%。在智能办公领域,大模型目前的意图识别准确率已达到 97%。

SuperCLUE是国内权威通用大模型综合性测评基准,其前身可追溯至第三方中文语言理解评估基准CLUE(The?Chinese?Language?Understanding?Evaluation)。自2019年成立以来,CLUE基准一直致力于提供科学、客观、中立的语言模型评测,其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多个被广泛认可的评估标准。根据CLUE多年测评经验,SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。?

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,19087人围观)参与讨论

还没有评论,来说两句吧...