商汤何以跑出大模型落地的「逃逸速度」?

当商汤董事长兼CEO徐立在一面颇具中国风的背景面前发布全新升级的「日日新SenseNova 5.0」大模型体系,预示着商汤成为了首家实现了云端边全栈布局的企业,而正是在这样一面背景之上,赫然写着「AI大模型时代 II」。


于是,人们不禁会问,商汤何以跑出了大模型落地的「逃逸速度」,实现了大模型性能超越GPT-4 Turbo的呢?


如果我们对商汤日日新5.0大模型以及商汤背后强大的算力支撑,有一个全面的了解,便不会对此有任何的惊讶。


正如徐立所言,「商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。」以此为基点,我们或许能够找到商汤跑出大模型落地的「逃逸速度」的内在逻辑。


商汤日日新5.0性能全面超越GPT-4 Turbo

 

自去年4月正式上线以来,商汤日日新大模型系统已经完成了五大版本的迭代升级。而此次升级,主要是基于超过10TB tokens训练、覆盖大量合成数据,采用混合专家架构,推理时上下文窗口可以有效到 200K 左右,以及聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。


得益于这些更新,日日新5.0的「文科能力」、「理科能力」以及多模态能力,全面得到了一次质的提升。


以日日新5.0和GPT-4回答趣味推理问题为例:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”,日日新5.0回答正确,GPT-4回答错误。


日日新5.0的这些能力的提升,可以在中文语境下,更好地为用户进行总结和问答,助力教育、内容等行业场景应用的落地。


同时,日日新5.0的数理能力、代码能力以及推理能力的大幅度提升,同样可以为金融、数据分析等场景的应用,提供有力支撑。


除了「文科能力」、「理科能力」之外,日日新5.0的多模态能力,同样表现优异。它不仅支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。


商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。


可见,商汤日日新5.0在「文科能力」、「理科能力」以及多模态能力上的突出表现,为其更好地助力大模型场景落地打下了坚实的基础。它不仅在主观评测上全面达到或者超越了GPT-4 Turbo,更加可以在中文环境下助力更多本土企业积极拥抱大模型时代带来的红利。


因此,如果我们要寻找商汤日日新5.0跑出大模型落地的「逃逸速度」的内在逻辑的话,文理兼修的全面发展以及多模态交互的卓越表现,无疑是最值得我们去关注的一个重要方面。


云端边全栈布局,商汤打造大模型产品矩阵


随着AI时代的来临,特别是当中心化算力需求向端侧扩展以及企业级边侧AI需求的不断增加,只有实现云、端、边的高效协同,才能真正助力大模型的落地。


正是基于这样一种认知,商汤在业内首次推出「云、端、边」全栈大模型产品矩阵,其中包括应用于终端设备的「商汤端侧大模型」,以及面向金融、代码、医疗、政务等多个领域的边缘产品「商汤企业级大模型一体机」。


据悉,商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。


扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端app快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。


值得一提的是,为了满足金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。


得益于商汤在云、端、边的全栈布局,商汤可以让AI大模型在更多的企业落地,让每一个企业的需求都能够得到最大限度的满足。


正因如此,


在办公领域,商汤基于“日日新”大模型的卓越代码生成及工具调用能力,助力WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。


在金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。


在出行领域,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。


可以预见的是,随着商汤日日新5.0的云、端、边全栈布局的不断深入,我们还将会看到更多的企业在商汤的助力之下实现AI应用的快速落地,不断地去拥抱AI时代来临的红利。


算力加持,商汤找到遵循「尺度定律」的路径


无论是日日新5.0的全面升级,亦或是商汤基于云端边的全栈布局,其实都离不开商汤打造的算力中心的加持与支撑。


正如商汤董事长兼CEO徐立所说的那样,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。


在本次技术交流日最后环节,商汤科技董事长兼CEO徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。


商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。


不难看出,商汤的文生视频,已经在路上了。


可以说,商汤找到了遵循「尺度定律」的路径。


正是基于这样一个全新的路径,商汤才可以不断地实现日日新5.0的升级,才可以打造了云、端、边的全栈布局,才可以满足越来越多的企业对于AI的新需求。


因此,如果我们要寻找商汤跑出大模型落地的「逃逸速度」的内在原因的话,商汤智能算力中心在背后的强大加持,无疑是最值得我们去关注的另外一个重要方面。


结语


从日日新5.0的知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo,到业内首次实现云端边全栈布局,再到商汤对于合作伙伴的深度赋能,乃至是商汤对于AGI时代的全面拥抱,我们都可以看出,商汤着实跑出了大模型落地的「逃逸速度」。


当商汤日日新5.0的性能超越 GPT-4 Turbo,当商汤比 GPT-4 Turbo更懂中国的消费者和企业,商汤无疑可以在“尺度定律”路径逐渐清晰的时刻,实现一次弯道超车,助力AI在更多场景落地,真正实现算法、算力、数据、应用和场景的全面协同。


—完—

 

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,710评论 4 376
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,839评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,295评论 0 255
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,776评论 0 223
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,198评论 3 297
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,074评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,200评论 2 322
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,986评论 0 214
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,733评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,877评论 2 254
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,348评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,675评论 3 265
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,393评论 3 246
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,209评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,996评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,212评论 2 287
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 36,003评论 2 280

推荐阅读更多精彩内容