雷军砸千万年薪，挖来95后“天才少女”（组图）

2024-12-29 来源：财经天下WEEKLY 原文链接评论0条

曾经在AI大模型布局上相对“佛系”的小米，开始加快步调了。最近，小米砸下了高昂年薪，招揽了一位AI行业大牛加入。

12月20日，据第一财经消息，DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米，她或供职于小米AI实验室，领导小米大模型团队。

雷军砸千万年薪，挖来95后“天才少女”（组图） - 1

知情人士透露，雷军对小米在大模型领域发力太晚感到担忧，于是亲自下场挖人，罗福莉的薪酬水平或在千万元级别。

另据12月26日界面新闻报道，小米正在着手搭建自己的GPU万卡集群。而小米大模型团队在成立时已有6500张GPU资源。

种种迹象表明，未来一年，小米要对大模型大力投入了。

01、罗福莉何许人也？

12月初，小红书博主AI Dance就曾透露，雷军近期亲自交流或面试了多家LLM（大型语言模型）公司的CTO和核心算法人才。

被雷军重金招募的罗福莉，在大模型圈内被冠以“95后天才少女”的头衔。

罗福莉硕士毕业于北京大学计算语言学研究所。2019年，因研二在NLP（自然语言处理）国际顶级会议ACL上发表了8篇论文，其中2篇为第一作者，曾登上知乎热搜。彼时，常在知乎下场回答问题的罗福莉，也一夜成为“知乎红人”。

硕士毕业后，罗福莉顶着“ACL8篇论文作者”的光环，加入了阿里达摩院机器智能实验室。这期间，她主导开发的多语言预训练模型VECO（同时支持多语言理解和生成的跨语言模型），被纳入阿里达摩院深度语言模型体系AliceMind。此外，她还主导了AliceMind的开源工作。

2022年，罗福莉离开阿里达摩院，加入幻方量化（量化对冲基金公司）从事深度学习相关策略建模和算法研究。此后，罗福莉加入DeepSeek，担任深度学习研究员，并参与了MoE大模型DeepSeek-V2的研发。

雷军砸千万年薪，挖来95后“天才少女”（组图） - 2

▲图源/罗福莉官方公号

罗福莉加入小米，不仅因其过硬的技术实力，她身上“天才AI少女”“95后AI萝莉”的标签，也很符合“营销天团”小米的调性。

今年5月，在DeepSeek-V2模型发布后，罗福莉在知乎上回答了如何看待该模型的问题。她称DeepSeek-V2与GPT4的价格相比，是“性价比之王”。这样“接地气”的互动，与小米的风格，可以说颇为契合。

罗福莉将加入小米的消息，印证了小米将在大模型领域加码的传闻。

2023年4月，小米在AI实验室中组建起大模型团队。AI实验室主任王斌在同年11月接受媒体采访时，曾表示小米“不搞AI的军备竞赛”。“内部认为，轻量级模型亦有其存在的市场空间，且在某些特定任务上相比千亿大模型亦能具备一定的优势。”

当时，王斌还透露，“这个团队的目标还是通用语言大模型，第一步的目标基座模型参数在几百亿，然后会视前期爬坡结果，再决定下一步投入。”

与此相对的，是友商的步步进击。2023年11月的vivo开发者大会上，vivo发布了自研十亿、百亿、千亿三个参数量级，由5款语言大模型组成的蓝心大模型矩阵。

对于“烧钱”的预训练大模型，小米相较于其他厂商更显谨慎。

2023年年度演讲中雷军公开表示：“我们做大模型的思路可能和很多公司不太一样，我们选择主力突破的是轻量化和本地部署。”

这也是同步还在造车的小米，要优先保住“现金王”在成本上的考虑。

云侧的大模型在保证巨大算力的前提下，要根据调用付费，成本极高。而端侧大模型在本地运算，如果将大部分AI推理场景放在端侧，能够大量节约云端算力开支。

对于一贯注重产品的小米来说，小米用户在芯片性能、摄像头技术、屏幕显示等方面有着相对更高的需求。因此，尽管端侧大模型在效果上难以媲美云端，但其在隐私保护、低延迟和成本控制方面的优势，也能为其产品“性价比”提供保障。

但随着各家厂商芯片算力的不断提升，AI Agent与手机硬件的融合已势不可挡。AI Agent 在人机交互中，能更精准地理解用户需求，更高效地完成任务。

特别是，随着国产手机价格迈过4000元大关，有无AI的加持，将成为区别手机高低端的关键。IDC预测，2025年中国新一代AI手机市场出货量将达1.18亿台，同比增长59.8%，整体市场占比达到40.7%。

在这一背景下，小米手机如果不在AI上挖深护城河，其高端化战略必将面临巨大挑战。

02、小米大模型为何先发后至？

据媒体消息，这一次雷军正是出于小米在大模型领域发力太晚的担忧，才亲自下场招揽人才。看起来，雷军已经开始开始担忧，小米对大模型的“激进程度”，不及友商的决心坚定。

今年年底，各大手机厂商的旗舰机发布会上，AI能力的介绍都占据极大篇幅。vivo不遗余力地宣传蓝心大模型，荣耀CEO赵明更在发布会上，让AI Agent现场点咖啡。

小米在自家手机的AI能力宣传上，显得低调了许多。小米15的新品发布会上，其AI功能更多是常规的AI写作、AI识音等功能。在讲解上，小米也将焦点更多聚集于性能车SU7 Ultra上，对大模型和AI能力的介绍略显平淡。

这也让市场产生许多猜测：小米手机的AI能力到底够不够硬核？

事实上，小米在AI布局有天然的场景和必要性。除了手机，小米还是全球最大的IoT设备制造商，旗下有诸多设备可以连接“小爱同学”智能体，也可供信息收集和场景联动。

此外，小米还有自研系统澎湃OS，未来又面临着“人车家”全生态布局。对于小米来说，大模型的难点或不在于认清其必要性，更多在于大模型要如何与小米产品，以及不同体系生态充分融合。

事实上，小米发力AI的时间并不算晚。2023年8月的年度演讲中，雷军表示，小米从2016年7月就开始布局AI。

雷军砸千万年薪，挖来95后“天才少女”（组图） - 3

2017年，小米正式成立AI实验室，当时团队仅有4人，仅用4个月就上线了小米第一代语音识别系统，并公开了在电视语音交互中端到端语音识别的研究成果。彼时，小米将其定义为中文端到端语音识别技术最好的识别率，语音助手“小爱同学”也同步上线。

自此，小米在AI领域的研发投入不断加大。2019年，小米开放了人工智能平台，开发者可使用小米的AI技术，开发和发布应用程序。

2020年，雷军在小米内部信中宣布，下一个十年，小米的核心战略升级为“手机×AIoT”。

此后，小米发布了自研芯片澎湃C1、成立自动驾驶团队、小米机器人实验室，进一步深化在AI领域的布局。去年8月的年度演讲中，雷军表示，AI相关的团队已经超过3000人。

未来，随着罗福莉的进入，小米对AI的布局力度还会不断加大。

11月12日，小米大模型团队发布公告表示，小米大模型已升级至第二代。大模型在10大能力纬度上表现，相较于上一代平均提升了超过45%，同时丰富了参数矩阵，有从0.3B到30B多个参数规模，分别适配云边端各侧设备。

去年年底的“MEET2024智能未来大会”上，AI实验室大模型团队负责人栾剑曾表示，小米认为未来的设计中，云端大模型的结合必不可少。

而从第二代大模型的参数规模上看，30B量级已经能适应云端场景下的需求，具备相当坚实的zero-shot/上下文学习或一些泛化能力。小米对大模型的适配场景，也可以逐渐不再局限于端侧。

关键词：小米罗福莉天才少女 GPU集群

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络[email protected]。