商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一，超越GPT-4 Turbo

栏目：锣响当当发布：2024-08-07 浏览：39 收藏

据《新民晚报》报到：几天前，国内权威大模型测评机构SuperCLUE榜单出炉，商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一，以总分80.03分的成绩刷新国内最好成绩，并且在中文综合成绩上超越GPT-4-Turbo-0125。这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

那么，它是怎么做到的呢？据介绍，“大医”以千亿参数规模的大语言模型“商量”为基模型，后者拥有万亿token预训练语料。在此基础上，“大医”利用超300亿token的高质量医学知识数据训练而成，数据范围涵盖医学教材、医学指南、临床路径、药品库、疾病库、体检报告、真实病历、医患问答和对话等。凭借丰富的知识储备和强大的逻辑能力，并在增量预训练、指令调优、奖励模型构建以及基于执业医师反馈的强化学习训练基础上，“大医”能够精确回答医疗健康领域专业问题。

商汤集团高级总监段琦介绍，以脑卒中为例，在临床中医生需要快速判断患者是脑出血还是脑缺血、出血的范围有多大、应该采用什么样的治疗方式，通过多模态医疗模型，医生可以在1分钟内给出专业建议。

在商汤AI大模型加持下，智能遥感也进化出新能力。

比如，面向农业管理部门农作物种植结构分析需求，提供“耕地种植结构AI遥感分析一张图”，直接给出耕地地块识别、作物识别、非粮要素识别等种植结构分析，实现耕地地块、作物识别、非粮要素识别的自动化、智能化、常态化。

相较传统遥感监测方案，无需大规模人工修订和样本标注，实现了大幅降本增效目的，可以为种植管理和相关政策制定提供稳定、快速、可靠的数据依据。

目前，商汤已将这种能力发布到商汤的“SenseEarth智能遥感云”上，供用户免费体验。“SenseEarth智能遥感云”不仅为传统遥感应用市场提供了更优质的服务，还大大降低了智能遥感的使用门槛。这一变革使得AI遥感技术能够深入到各个产业细分场景中，让更多用户使用遥感数据。

除了这些，由日日新基础大模型所衍生出的商量、秒画、如影、格物、琼宇等应用已开始在各行各业落地……此前，商汤科技董事长兼CEO徐立在相关发布会上表示，一方面，现阶段大模型发展已进入落地阶段，如何与产业、应用场景结合是关键一环；另一方面，“尺度定律”路径逐渐清晰，“涌现”时刻不定出现，前瞻探索最先进的大模型技术是重中之重。而商汤将坚定朝着通用人工智能的目标前行，突破数据与算力的限制，引领大模型的创新与落地。