商汤科技：以长期主义跑出大模型加速度

发表于：2023-07-18 来源：

本文来源 | 南方产业智库

撰文 | 郜小平

只需输入少量简单提示词，就能自动延展生成内容丰富的图像结果。有进阶需求的模型创作者，还可通过简单拖拽的方式快速完成模型微调，打造个人专属的生成式AI模型。

大模型的突破掀起了人工智能的新一轮技术革命，随之而来的是产业需求呈现爆炸式增长，全新的应用场景和应用模式正迅速涌现。在近日举行的2023世界人工智能大会（WAIC）上，商汤科技推出的“商汤日日新SenseNova”大模型体系迎来全面升级，以及在该体系下的一系列大模型产品更新和落地成果。

无论是底层技术抑或是商业化落地的业务场景，商汤科技都迎来了加速。坚持长期主义，商汤科技选择了属于自己的一条技术道路——创造AI底层生产工具，为行业实现AI赋能，降低生产要素的成本。

“我们要从根本上降低大模型的下游应用成本和门槛，让大模型的产业价值在千行百业中绽放。”商汤科技董事长兼CEO徐立如是说。

深入千行百业，多元结构提升抗风险能力

自4月发布“日日新”大模型以来，商汤围绕大模型体系及相关产品的技术迭代与应用落地持续加快。

一方面，商汤把大模型做大，商汤大模型体系在其“大模型+大装置”的AGI战略布局下，正进行着高速迭代。商汤希望，持续推动AI基础设施能力的跃进提升，打造通用能力更加强大的基础模型。

另一方面，商汤又把“大模型做小”，进一步高效融合不同垂直领域的专业知识，构建更懂行业、更具专长的专业大模型。作为千亿级参数的自然语言处理模型，商汤“商量SenseChat2.0”版本突破了大语言模型输入长度的限制，并推出不同参数量级的模型版本，可适配移动端、云端等不同终端及场景的应用需求。

除此之外，商汤大模型体系还带来了一系列产品升级，例如商汤“如影SenseAvatar2.0”数字人生成平台，语音和口型流畅度提升30%以上，实现4K高清视频效果，并带来AIGC生成形象及数字人歌唱功能。

另外，商汤“琼宇SenseSpace2.0”的空间重建效率提升20%，渲染性能提升50%，在每秒1200TFLOP算力支持下，每100平方公里场景的建图时间仅需38小时即可完成；琼宇平台通过海量高精度数字资产的生产，实现静态现实世界到数字世界的精准映射，无需人工修模即可达到超逼真的视觉效果，大幅降低传统数字孪生领域人工建模的成本，满足数字孪生、建筑设计、影视创作等行业需求。

而商汤“格物SenseThings2.0”对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

在珠宝行业，依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻，细致展现商品工艺特点，提升顾客购物体验。

曾经依靠单一行业收入，如今的商汤成为多元结构，提升抗风险能力大大增强。与此同时，商汤的AI能力在各种不同的场景落地，积累了大量的“场景优势”与“场景经验”，这对于通用型技术的开发也是有巨大的助推作用。

“大模型+大算力”，加速能源电力智能化

AI的发展最终是为了降低生产要素成本，惠及全人类。

伴随着技术的进步，大模型的广泛应用能够以较低成本解决好困扰电力能源行业多年的问题。大模型在认知智能上的突破，可以让AI比以前更好、更深度地掌握行业知识，成为行业专家，以更高效、更容易理解的方式辅助人类工作，在提高智能化水平的同时降低生产成本和难度。

早期商汤为头部电力企业提供了不少特定场景下的专属模型，如电力设备缺陷分析识别模型、配网线路可视化三维建模等。也由此建设了行业人工智能基础设施，并开始提供大模型的训练基础设施、算法、训练和微调服务，服务于电力的输发配变用等各个方面。

商汤科技数字能源总经理王贵珠表示：“大模型在电力行业的应用场景，商汤会围绕三大类展开，第一类，自然语言处理大模型可以服务于客服场景，帮助电力行业更好地提升用户体验；第二类，视觉大模型会更好地解决巡检难题，并为运维场景提高效率，商汤也已经陆续做了不少试点案例；第三类，决策大模型会助力整个电力系统数智化升级，帮助能源行业更好地应对新能源发展带来的行业转变，以前电力系统的输发配变用都是火力发电，具有非常强的计划性，现在能源结构调整后，大量的光伏、风电上网发电并网，给发电侧带来了一定的波动性、随机性，对调度提出极大的要求。”

一位电力专家在结合了大模型技术的系统中输入指令：“帮我看一下这张图片有哪些部件，以及存在哪些缺陷。”大模型就会自动检测图片，并得出一个结论：一块非常不起眼的地方，缺失了一块玻璃绝缘子。

在电网巡检中，电线上忽然有一个不明状况的东西，只需通过少量数据的预先训练，多模态模型就能够识别出，原来这是一条高压线上出现了鸟巢，大模型可以给出鸟巢可能引发风险的预判。

在以前，AI模型往往需要重复大量枯燥的数据标注工作，而采用视觉大模型后，可实现自动化标注，让员工有时间做更有价值的工作。传统的AI模型到达一定程度后，准确率很难继续提高，而使用大模型相关技术后，模型的准确率比以往提升了10%，能够更好地识别电线、电房、电站的缺陷。

大模型在电力系统的另一大应用是电力调度。在防误操作中，如果遇上线路停电，传统的流程机制要先断开中开关，再拉开边开关，这个过程中程序员将代码“锁定”，适用于日常已形成流程化的工作。大模型的不同之处在于，它会针对操作指令做语义分析，结合知识图谱，找到相应任务和设备的操作，因此可以针对一些新的突发状况做出灵活处理。

在商汤看来，技术应该帮助提高人的技能并实现降本增效，正如工业场景中的缺陷检测，首先应该是帮助员工，而不是取代员工。

坚持长期主义，深耕长尾服务个性化

提到大模型，与之高度关联的是算力，特别是参数量动辄千亿级别的。这意味着，首先需要强大的运算能力作为根基，因此，与其他不少厂商“借算力”不同，商汤一开始就以“大模型+大装置”思路锚定大模型。

商汤还前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore，打通了算力、算法和平台，成为能够结合业务侧数据的基座，被认为是支持大模型训练的基础。

其实，人工智能领域的一些长尾场景，这是很容易被人忽略的环节——从人们需求的角度来看，大多数的需求会集中在头部，而分布在尾部的需求是个性化的，零散的、小量的需求。

由于频次低，缺少大数据支撑做训练，一旦出现问题产生的后果就非常严重。而基于“大模型+大装置”，可拓展的场景会越来越多。

从人的角度来看，更多长尾场景也被纳入服务，针对一些特定场景做到不断升级；从市场格局来看，当核心功能的差距不明显时，谁能够解决更多的长尾问题，谁就能满足消费者更好的体验，获得更多消费者的认可。

这就是商汤通往通用人工智能研究的一条重要途径：将视觉、语音等多模态感知能力接入大语言模型，增强大模型与现实世界的交互能力。这不仅可以解决特定领域的知识，还可以解决开放世界问题。

大装置解决的是AI行业可以低成本使用的问题。长久以来，“定制化”是很多人对AI行业的印象，每一个应用场景都要开发新的AI算法，需要一个庞大的团队开发，但换场景则需要重新开发，如果按照这种方式，AI落地就会成为不可能完成的任务。

基于大装置的能力，商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型，持续演进并广泛支持各种应用。

随着人工智能迈入以超大模型为标志的全新阶段，是否拥有超大模型与高算力成为衡量一家人工智能企业能力的重要标准。正是长期坚定AI赛道，坚定布局、踏实前进、长期主义，让商汤可以快速打造出技术领先且实用的国产大模型。

苟日新，日日新，又日新。不断进化中的商汤，又会给外界带来怎样的期许？