1. 首页 > 手游专区

揭秘 揭秘电影

作者:admin 更新时间:2025-02-23
摘要:本文目录导读:多模态大模型Step-1.5V的升级图像生成大模型Step-1X的亮相大模型的演进之路在2024年的全球人工智能与机器人大会(WAIC)上,阶跃星,揭秘 揭秘电影

 

本文目录导读:

>

  1. 多模态大模型Step-1.5V的升级
  2. 图像生成大模型Step-1X的亮相
  3. 大模型的演进之路

在2024年的全球人工智能与机器人大会(WAIC)上,阶跃星辰公司以其强大的技术实力和创新的模型矩阵,成为了众人瞩目的焦点,这家几乎是在国内大模型公司中亮相最晚的创业公司,却凭借万亿参数MoE大模型和多模态大模型的组合,成功站稳了大模型创业公司的第一梯队,本文将详细揭秘阶跃星辰在此次大会上亮相的万亿MoE+多模态大模型矩阵,并探讨其背后的技术思路和应用前景。

阶跃星辰的万亿MoE大模型——Step-2

Step-2是阶跃星辰公司在此次大会上推出的重磅产品,一个拥有万亿参数的MoE(Mixture of Experts,专家混合)大模型,早在2024年3月,Step-2的预览版就曾与公众见面,而此次正式版的发布,更是将其能力全面推向了一个新的高度,Step-2在数理逻辑、编程、中文知识、英文知识以及指令跟随等方面,都展现出了逼近GPT-4的体感。

参数量是衡量AI模型能力的一个重要指标,当参数量突破万亿时,模型的数学、编程等涉及推理的能力都会显著提升,相比之前的千亿级别模型,Step-2能解决的数理逻辑、编程问题明显更难,一些基准评测的量化结果也充分证明了这一点,Step-2的中英文能力和指令跟随能力也实现了明显提升,为用户提供了更加流畅和智能的交互体验。

Step-2之所以表现如此优异,一方面得益于其巨大的参数量,另一方面也离不开其独特的训练方法,在训练MoE模型时,阶跃星辰选择了完全自主研发、从头开始训练的方式,而不是通过重新利用训练过程的中间结果或已经训练好的模型来提升性能,这种方式虽然训练难度高、算力消耗大,但能够获得更高的模型上限。

在MoE架构设计方面,阶跃星辰也进行了一系列创新,包括部分专家共享参数、异构化专家设计等,这些创新不仅确保了某些通用能力在多个专家之间共享,同时也保留了每个专家的独特性,从而增加了模型的多样性和整体性能,基于这些创新,Step-2不仅总参数量达到了万亿级别,每次训练或推理所激活的参数量也超过了市面上大部分的密集模型。

多模态大模型Step-1.5V的升级

在Step-2的坚实基础上,阶跃星辰进一步训练出了多模态大模型Step-1.5V,这款模型不仅拥有强大的感知和视频理解能力,还能够根据图像内容进行各类高级推理任务,如解答数学题、编写代码、创作诗歌等。

Step-1.5V的升级主要体现在其多模态理解能力上,与之前的版本相比,它的感知能力大大提升,能够理解复杂图表、流程图,准确感知物理空间复杂的几何位置,还能处理高分辨率和极限长宽比的图像,它还能理解视频中的物体、人物、环境以及整体氛围和人物情绪,为用户提供了更加丰富的视觉体验。

在Step-1.5V的诞生过程中,Step-2作为监督模型发挥了重要作用,在Step-1.5V进行基于人类反馈的强化学习(RLHF)训练时,Step-2为其提供了宝贵的指导和支持,这使得Step-1.5V的推理能力得到了显著提升,能够根据图像内容进行各类高级推理任务。

图像生成大模型Step-1X的亮相

除了Step-2和Step-1.5V外,阶跃星辰还推出了图像生成大模型Step-1X,这款模型在语义对齐和指令跟随方面表现出色,同时针对中国元素进行了深度优化,更适合国人的审美风格。

基于Step-1X打造的《AI+大闹天宫》互动体验就是其多模态能力的生动体现,在这款游戏中,用户可以通过上传个人照片并参考《大闹天宫》画风生成自己在仙界的形象照,随后,系统会引导用户进入一个交互式的剧情选择和交谈环节,根据用户的选择和回答评估出MBTI人格类型,并在天庭为用户“安排”一个差事,整个过程中,所有的互动问题、用户形象、分析结果都是模型实时学习特征后生成的,真正做到了千人千面和无限剧情的可能。

Step-1X的这些优异表现离不开阶跃星辰全链路自研的DiT模型架构,为了让更多人用上该模型,阶跃星辰为Step-1X设计了600M、2B、8B三种不同的参数量,以满足不同算力场景的需求。

大模型的演进之路

在阶跃星辰创始人姜大昕看来,大模型的演进会经历三个阶段,在第一个阶段,语言、视觉、声音等各个模态是独立发展的,每个模态的模型专注于学习和表征其特定模态的特点,在第二个阶段,不同的模态开始走向融合,但理解和生成任务依然是分开的,这造成模型理解能力强但生成能力弱,或者反之,在第三个阶段,生成和理解被统一在一个模型里,然后与机器人充分结合,形成具身智能,具身智能会主动探索物理世界,然后逐步演变成世界模型,进而实现AGI(Artificial General Intelligence,通用人工智能)。

阶跃星辰正在国内印证这条路线,他们相信,“万亿参数”和“多模融合”是通往AGI的必经之路,Step-2、Step-1.5V和Step-1X就是他们在这条路上达成的节点,这些节点一环套一环,共同构成了阶跃星辰的万亿MoE+多模态大模型矩阵。

随着技术的不断进步和应用场景的不断拓展,阶跃星辰的万亿MoE+多模态大模型矩阵将在未来发挥更加重要的作用,我们期待这家公司能够继续引领国内大模型领域的发展潮流,为用户带来更加智能和便捷的体验。