资讯

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。第二作者张新雨是字节跳动研究员,主要研究方向为视觉生成模型。李崇 ...
大利 SISSA Medialab 与瑞士 EPFL(洛桑联邦理工学院)联合研究,首次从理论角度验证:「Transformers」神经网路在训练过程中会出现如同物理相变的转折点,初期阶段以「位置」为依据理解语句,当训练资料量足够後,模型会突然切换到以 ...
为此,来自加州大学伯克利分校和MIT的研究者们联合提出了Sparse VideoGen(SVG)框架。这是一种完全无需重新训练模型的视频生成加速方法。该框架通过挖掘并利用3D Full ...
早在上个月,Manus 联合创始人张涛便曾宣布,公司已将全球总部迁至新加坡,并在东京和加州设有办公室。尽管官方未正面回应,只称是「基于经营效率的调整」,但出海所引发裁员等一连串争议问题,也让外界普遍猜测其是否正在「跑路」。
随着训练时间的增加,EBT的思考能力持续提升,性能提升幅度从4%-8%逐步增长到10%-14%。这种渐进式的能力提升,意味着EBT模型在长期训练中的稳定性和适应性,为实际应用提供了保障。研究人员的扩展实验显示,EBT在不更换分词器的情况下,成为首个在 ...
Manus从诞生第一天起就是一款值得关注的产品。 只不过在很长一段时间里,它的争议盖过了产品本身,团队本身也并未系统地分享过自己产品背后的技术。 这逐渐造成一个有趣的矛盾:Manus诞生到今天,它做出的交互方式创新,不只塑造了外界对“AI Agent”的印象,也在受到一众竞争对手乃至模型大厂的认可或跟随,这些关注的焦点并非在它炮制的“概念”,而是实打实来自它的技术方案和产品思路,先是Anthrop ...
2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推 ...
作者|王兆洋邮箱|wangzhaoyang@pingwest.comManus从诞生第一天起就是一款值得关注的产品。只不过在很长一段时间里,它的争议盖过了产品本身,团队本身也并未系统地分享过自己产品背后的技术。这逐渐造成一个有趣的矛盾:Manus诞生到今天,它做出的交互方式创新,不只塑造了外界对“AI ...
“之前生成式AI怎么变现?靠卖课。”这是行业内一句广为流传的热梗,但周鹏说这已成为过去式。他称今年很少有头部AI主播靠培训变现,因为AI生成的作品已然可以直接实现商业化。
大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。
孩之宝成立于1923年,生产著名的玩具和游戏,包括培乐多彩泥、变形金刚、糖果乐园和龙与地下城。 尽管孩之宝尚未因关税问题涨价,但Cocks预计, 该公司产品的整体涨价即将到来,很可能就在秋季。