纳指如期突破年内高点;A股市场处于节前交易平淡期
美国市场
一、纳指如期突破年内高点
我们前期观点认为,展望1月下旬,宏观事件(特朗普就职典礼)、货币政策(1月27日日本央行加息、1月30日美联储暂停降息)、企业盈利(Tesla财报)叠加,仍然将造成美股市场有较大波动,我们预计,纳斯达克指数主要的目标是向上冲击并突破年内高点20007点。
上周,虽然日本央行如期加息,但由于本次BOJ与市场的沟通相对充分,而2024年的Carry Trade已经使得全球资本市场对日本央行加息有了充分准备,因此即使日本央行加息,但纳斯达克指数如期突破20007点,创出年内新高,消化了10Y美债收益率高企、货币政策摇摆等利空,表明美股依然维持在牛市趋势中。
2025年1月20日,特朗普宣誓就任美国第47任总统,并发表就职演讲,并签署了多达46项“总统行动”(包含行政令或备忘录)。截至1月24日,其已累计签署60项总统行动。特朗普达沃斯讲话重申强硬的关税立场,要求产油国压低油价,要求美联储及全球降低利率。
我们前期在Trump Trade中已经分析,打击非法移民、对外加税对内减税、发展传统能源、宽松金融监管以及发展AI将是本届美国政府的主要工作方向。其中,关于发展AI的、由软银、OAI和甲骨文联合推出的STARGATE星际之门项目超出市场预期,其5000亿美金的投资规模更是带动北美算力链大涨。
下周对于美股市场而言将是2025年一季度最重要的一周,美联储或将首次暂停降息并进一步明确2025年全年的点阵图,与此同时,特斯拉、Meta、微软将发布其2024年四季度业绩并对2025年全年的资本化开支、经营业绩进行展望,给2025年的投资奠定基础。
A股市场
一、A股市场处于节前交易平淡期
我们前期观点认为,从经济基本面来看,震荡市和K型结构将是2025年全年A股市场的主基调,涉及地产、医药、消费、中概互联等板块的标的仍然将需要时间等待反转,仅有北美AI供应链、机器人供应链、智能驾驶等与美国科技周期共振的板块和标的具有阶段性的投资机会。
上周,虽然财政部、证监会再次在上午9点召开新闻发布会发布利好政策,但由于A股交易适逢春节,因此做多情绪有限,A股市场整体交易平淡。观察本轮政策落地后市场反应,与我们前期观点相同——后续A股投资人会对政策的要求越来越严苛,仅仅进行新闻发布会型的政策吹风已经不足以掀起一轮类似于2024年9月24日的猛烈上升攻势。
【产业分析】——Deepseek-R1正式发布
1月20日: DeepSeek-R1 正式发布,AI业界被 DeepSeek的论文震撼,对于DS的讨论开始蔓延到资本市场,AMD开始将DS-V3模型集成到Instinct MI300X GPU上。
DeepSeek用更少的算力实现更复杂的任务,使得大模型不再局限于互联网巨头,将有更多的玩家可以参与进来,加速应用、端侧的普及。未来一两年,我们大概率将见证更丰富的推理芯片产品、更繁荣的LLM应用生态。次DeepSeek体现出国内大模型正在快速追赶海外大模型,尽管仍有较大差距,但这个差距正在缩小,大幅提振了国产大模型以及整个人工智能产业链发展的信心。
这一次DS在海外大火关键还是拥有大量的原创技术,主要要点如下:
⚫ 多头潜在注意力机制(MLA):#高效推理的关键成本下降一个数量级,注意力机制一直是大模型的核心技术,注意力机制需要计算Q、K、V的矩阵,DS的MLA注意力机制通过将K和V联合映射到低维空间,显著降低显存占用提升推理的性能,量化比较DeepSeek V3的价格是Claude 3.5 Sonnet的9%;
⚫ FP8混合精度训练技术:#大幅降低训练成本,计算机精度要求越低训练成本越低,DS大规模验证FP8在超大规模模型训练的有效性,DS引开发DualPipe提高计算和通信的并行度大大提升训练效率。
⚫ 大规模强化学系 RL:#后道训练版ScallingLaw解决了高成本构建训练数据的问题,通常模型需要SFT+RL方式进行精调,但是SFT需要大量的精标数据,需要大量人力完成成本极高,DS一开始不使用SFT直接RL效果非常好,后面加速少量CoT(数千量级)+RL取得非常好的效果,甚至随着CoT步长的增加出现顿悟的现象;
⚫ 混合专家MoE无辅助损失负载均衡机制:#性能与成本间平衡,DeepSeek V3每个MoE层包含1个共享专家和256个路由专家,每个Token会选择8个路由专家最多路由到四个节点,模型根据输入数据特点高效激活专家模块避免不必要的计算;
Deepseek-R1发行,对产业的影响如下:
⚫ 算力需求:单次训练成本和推理成本下降是确定性的,但是并不意味着算力就不稀缺,现在还有大量的工程化尝试有待挖掘,因此算力还是至关重要的;
⚫ 应用端:使用和训练成本下降对应用是最大的利好,尤其是o1类型引入后极其消耗算力的长思考型推理,AI Agent会极其受益;
关于Deepseek-R1对投资的影响,我们认为,其会阶段性影响全球对算力端核心公司的估值定价,但我们并未观察到其会真正影响算力端相关公司数据的产业事实。
Deepseek-R1对大模型训练端优化后的降本切实存在,确实存在一部分前期由于算法原因导致的算力冗余需求减少。同时,由于DS-R1证明了大模型的后发优势极其明显,因此AI训练会从军备竞赛逐步转向后发制人,除OAI、XAI等少数企业依然会坚持每年数百亿美金的投入外,其他AI企业或会选择等待大模型突破后再后发制人,导致算力投资预算发生变化。因此,DS-R1的横空出世会导致短期内投资人对算力端的集中避险,影响到相关公司的估值定价。
但从OAI(微软)、Meta等公司的Capex预算看,其依然维持了同环比的高增长,而从中长期角度出发,大模型的降本增效带来的并不会是算力需求的下降,而是将算力应用于更极致的大模型性能提升以及满足海量的推理需求。因此,当前仅凭DS-R1即断定全球算力需求崩塌仍然稍显武断,我们预计市场将需要在1月29日核心企业财报中给出更加明确的Capex预期后再做出进一步的判断。
END