商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一,超越GPT-4 Turbo

栏目:锣响当当 发布:2024-08-07 浏览:9 收藏

据《新民晚报》报到:几天前,国内权威大模型测评机构SuperCLUE榜单出炉,商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一,以总分80.03分的成绩刷新国内最好成绩,并且在中文综合成绩上超越GPT-4-Turbo-0125。这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

那么,它是怎么做到的呢?据介绍,“大医”以千亿参数规模的大语言模型“商量”为基模型,后者拥有万亿token预训练语料。在此基础上,“大医”利用超300亿token的高质量医学知识数据训练而成,数据范围涵盖医学教材、医学指南、临床路径、药品库、疾病库、体检报告、真实病历、医患问答和对话等。凭借丰富的知识储备和强大的逻辑能力,并在增量预训练、指令调优、奖励模型构建以及基于执业医师反馈的强化学习训练基础上,“大医”能够精确回答医疗健康领域专业问题。

商汤集团高级总监段琦介绍,以脑卒中为例,在临床中医生需要快速判断患者是脑出血还是脑缺血、出血的范围有多大、应该采用什么样的治疗方式,通过多模态医疗模型,医生可以在1分钟内给出专业建议。

在商汤AI大模型加持下,智能遥感也进化出新能力。

比如,面向农业管理部门农作物种植结构分析需求,提供“耕地种植结构AI遥感分析一张图”,直接给出耕地地块识别、作物识别、非粮要素识别等种植结构分析,实现耕地地块、作物识别、非粮要素识别的自动化、智能化、常态化。

相较传统遥感监测方案,无需大规模人工修订和样本标注,实现了大幅降本增效目的,可以为种植管理和相关政策制定提供稳定、快速、可靠的数据依据。

目前,商汤已将这种能力发布到商汤的“SenseEarth智能遥感云”上,供用户免费体验。“SenseEarth智能遥感云”不仅为传统遥感应用市场提供了更优质的服务,还大大降低了智能遥感的使用门槛。这一变革使得AI遥感技术能够深入到各个产业细分场景中,让更多用户使用遥感数据。

除了这些,由日日新基础大模型所衍生出的商量、秒画、如影、格物、琼宇等应用已开始在各行各业落地……此前,商汤科技董事长兼CEO徐立在相关发布会上表示,一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环;另一方面,“尺度定律”路径逐渐清晰,“涌现”时刻不定出现,前瞻探索最先进的大模型技术是重中之重。而商汤将坚定朝着通用人工智能的目标前行,突破数据与算力的限制,引领大模型的创新与落地。

 

确认删除?
回到顶部
在线客服
己有书馆