技术攻防与供应链安全
数据批次: 0
新闻区域: 国内新闻
新闻数量: 17
新闻 1: 甲骨文跌了,英伟达慌了,巨头们开始算账了
来源: 今日头条 - 自媒体
主题: AI产业巨头战略调整、供应链竞争及市场投资逻辑变化
摘要:
市场对科技股投资趋于理性,甲骨文、英伟达等股价下跌。在此背景下,科技巨头正调整AI战略:谷歌和Meta组建“TorchTPU”联盟挑战英伟达,亚马逊整合AI模型、自研芯片和量子计算以构建完整生态并避免受制于人,OpenAI等则寻求独家数据以增强模型竞争力。市场正经历冷静调整期,淘汰泡沫。
分析:
它揭示了AI产业中“芯片/算法的‘封锁’、‘断供’、‘制裁’及‘供应链中断’”的风险及企业应对策略。正文中明确提到谷歌和Meta组建“TorchTPU”联盟“针对英伟达的动向”,以及亚马逊“打造从底层芯片到上层模型的完整体系”以“避免受制于人”,这些都直接关联到AI核心技术(芯片、框架)的供应链安全和战略自主性竞争。
正文:
12月17日美国股市出现波动,三大指数集体下跌,科技股遭受重挫,纳斯达克指数跌幅接近2%,多数科技股呈现跌势,甲骨文单日下跌超过5%,本月累计跌幅已超11%,有消息称其在密歇根州的百亿数据中心项目合作方Blue Owl Capital退出投资,虽然公司出面澄清,但市场信心已然动摇。
芯片股也跟着下跌,英伟达跌幅接近4%,AMD直接超过5%,博通也跌了4%以上,这一个月里这些股票平均下跌近两成,投资经理Brian Mulberry提到,现在大家关注的不是技术有多厉害,而是谁能赚回钱来,以前人们问的是“能不能做出来”,现在变成“什么时候能回本”,这种变化很关键,说明资金开始选择去处。
现在大家都更关注自由现金流,因为资产负债表能做得好看,但现金流没法作假,公司投入大量资金建设数据中心、购买芯片、维持团队运营,最终要看有没有现金进账,这才是关键,市场在重新判断哪些企业真正盈利,哪些只是在消耗资金讲故事,所以资金逐渐流向银行和能源这类传统行业,它们稳定可靠,能够分红,收益看得见也摸得着。
大公司也没停下脚步,都在悄悄调整方向,谷歌和Meta最近组建了一个小联盟叫“TorchTPU”,目的是让他们的TPU芯片更容易在PyTorch框架中使用,这是针对英伟达的动向,因为现在AI开发大多使用PyTorch,哪家芯片对PyTorch支持得好,哪家就能占据优势地位,他们还在讨论资源交换的事,比如互相借用TPU来吸引开发者加入。
亚马逊那边动作更大,CEO贾西宣布成立一个新部门,让老将Peter DeSantis带队,把AI模型、自研芯片和量子计算全部整合起来,这不是为了炫耀技术,而是想打造从底层芯片到上层模型的完整体系,让AWS云服务更有竞争力,说白了,就是为了避免受制于人。
OpenAI、Anthropic和谷歌这些公司,不再只看重算法,他们开始与生物科技企业、医疗机构、金融软件公司开展合作,想用对方的数据训练下一代模型,基因组数据、用户行为记录、财务报表,这些都像埋在地下的矿藏,越独家越好,谁手里有高质量数据,谁就能在人工智能的竞争中占据上风。
非科技行业也有动作,诺华公司和罗氏公司两家制药企业,正与美国政府商量药品定价的事情,他们打算用降低价格的方式,来换取关税方面的优惠条件,这种做法之前辉瑞和阿斯利康已经用过,效果挺好,现在这些药企也在学着做政策对冲,一方面控制自己的成本,一方面争取更多政策空间。
整个市场的想法变了,过去大家觉得花钱多就是本事,现在却认为赚钱快才可靠,AI虽然依旧火热,但人们变得更实际,投资人不再随便追捧高价项目,而是仔细计算收支,技术再出色,如果半年或一年内看不到盈利,资金就会离开,这不是热潮消退,而是冷静阶段,能在降温时稳住脚步的人,才是真正成功者,我倒认为这次调整不一定是坏事,至少能挤掉一些泡沫,留下真正有实力的企业。
主题分类:
技术攻防与供应链安全
新闻 2: 笑掉大牙!美国军工新贵竟说中国靠“光棍人海”打仗?
这年头,没点离谱言论都不好意思在美军工圈混了是吧?
近期,美国所谓的“AI军工新星”、安杜里尔公司创始人帕尔默·勒基,在一场采访里抛出的言论,直接突破了人类认知的下限。这位靠着蹭特朗普团队热度、拿国防军费续命的“新贵”,大言不惭地宣称:中国不会重
来源: 今日头条 - 自媒体
主题: 美国军工高管对中国军事技术(无人机与自动化)的错误认知与中国实际发展及供应链依赖
摘要:
美国AI军工新贵帕尔默·勒基声称中国将依赖“光棍人海战术”而非无人机作战,引发广泛争议。新闻反驳指出,中国在无人机技术(如“九天”大型无人机)和工业自动化(机器人存量全球第一)方面均处于世界领先地位,且勒基的公司自身大量使用中国制造的关键零部件。文章批评勒基的言论是为迎合反华情绪并骗取军方订单。
分析:
该新闻具有高价值。首先,它涉及美国“AI军工新星”帕尔默·勒基通过散布“中国靠‘光棍人海’打仗”的“虚假信息”和“认知操纵”言论,以“迎合美国内部的反华情绪”并“骗取军方订单”,这符合“政治与意识形态安全”维度。其次,新闻揭示了勒基的公司“大量使用中国制造的关键零部件,从发动机到电子元件几乎全靠中国供应链”,凸显了美国军工企业对中国“供应链”的依赖,这与“技术攻防与供应链安全”维度相关。
正文:
笑掉大牙!美国军工新贵竟说中国靠“光棍人海”打仗?
这年头,没点离谱言论都不好意思在美军工圈混了是吧?
近期,美国所谓的“AI军工新星”、安杜里尔公司创始人帕尔默·勒基,在一场采访里抛出的言论,直接突破了人类认知的下限。这位靠着蹭特朗普团队热度、拿国防军费续命的“新贵”,大言不惭地宣称:中国不会重视无人机作战,因为中国男光棍太多,真打起来只会搞人海战术,根本没必要花大价钱搞无人机技术。
听完这话,我差点以为这位仁兄是刚从上个世纪的冷战活化石堆里爬出来的,还是说他为了骗美国纳税人的钱,已经彻底放弃了基本的事实判断能力?且不说把“男光棍”和“人海战术”绑定在一起有多充满偏见和无知,单是这番对中国无人机发展的胡说八道,就足以让全球军工圈笑掉大牙。尤其是他说这话的时候,距离中国“九天”大型无人机圆满首飞才过去没几天,这波闭眼输出,简直是精准往自己脸上贴巴掌。
咱们先说说这位勒基口中“中国不会搞”的无人机技术,到底发展到了什么地步。
12月11日,由航空工业一飞院设计的“九天”无人机在陕西蒲城成功首飞,这一消息直接让全球无人机领域震动。作为我国自主创新的大型通用无人机平台,“九天”的硬实力直接拉满:机长16.35米,翼展25米,最大起飞重量16吨,载荷能力更是达到了6吨,最大飞行高度1.5万米,转场航程足足7000公里。这起飞重量已经超过了美国的“全球鹰”战略无人侦察机,而且“九天”的载重能力是“全球鹰”拍马都赶不上的。
而且,“九天”可不是只会侦察的“花瓶”。在去年的珠海航展上,它就凭借8个外挂点惊艳全场,空对空导弹、反舰导弹、空对地导弹、滑翔炸弹等有人战机的常规武器它都能挂载,既能对空作战,又能执行对地、对海甚至对水下目标的打击任务,堪称无人机中的“六边形战士”。
这样一款集侦察、打击、运输等能力于一体的重型无人机,要是勒基稍微有点基本的信息渠道,也不至于说出“中国不重视无人机”这种蠢话。
更讽刺的是,勒基的安杜里尔公司主打AI无人系统,可他们的无人机产品不仅频频在测试中失败,被诟病为“工业垃圾”,还大量使用中国制造的关键零部件,从发动机到电子元件几乎全靠中国供应链。
一边用着中国的核心部件,一边嘴硬说中国不会搞无人机,这波“吃里扒外”加“睁眼说瞎话”的操作,属实是把投机分子的嘴脸演绎得淋漓尽致。
他心里门儿清中国无人机制造水平有多高,只是为了讨好美国民众、骗取军方订单,才故意抛出这种漏洞百出的言论,其心可诛。
再说说勒基赖以立论的“人海战术”谬论,这就更暴露他的无知了。一个国家会不会搞无人化作战,核心看的是工业基础和自动化水平,而不是什么“光棍数量”。
国际机器人联合会发布的《2025年世界机器人报告》显示,2024年中国在役工业机器人存量已经突破202.7万台,直接位居全球首位,而且3年内实现了翻倍增长。
2024年全球新安装工业机器人54.2万台,中国就占了29.5万台,超过世界其他地区的总和。现在中国工厂里的机器人数量是美国的五倍,制造业机器人密度已经跃居全球第三,自主品牌工业机器人国内市场占有率更是达到了58.5%,在纺织、木材制造等领域,中国本土供应商的市场份额甚至接近100%。
从数据看,中国早已进入自动化、智能化制造的新时代,各行各业都在大规模用机器人替代人工,怎么到了勒基嘴里,就成了“靠人海战术”的落后国家?
说到底,勒基的这番言论,本质上就是为了迎合美国内部的反华情绪,给自己的公司捞取更多国防订单的投机话术。他既无视中国在无人机领域从技术研发到产业生态的全面领先,也对中国制造业自动化、智能化的浪潮视而不见,仅凭自己臆想的“光棍人海战术”偏见,就敢对中国的科技发展指手画脚,活脱脱一副“井底之蛙”的可笑模样。
要知道,现代战争早已不是“人多就能赢”的年代,无人化、智能化才是未来战场的核心趋势。中国之所以能在无人机领域实现弯道超车,靠的是完整的工业体系、海量的技术人才和持续的科研投入,而这恰恰是勒基的安杜里尔公司最欠缺的东西。毕竟,靠嘴炮骗来的订单,终究掩盖不了其技术落后、依赖中国供应链的尴尬现实。
主题分类:
技术攻防与供应链安全
新闻 3: arXiv 每日论文 20251218 | 音频
来源: 微信 - 自媒体
主题: 音频AI技术研究进展与安全攻防
摘要:
该新闻汇总了arXiv上关于音频领域的最新研究论文,涵盖语音处理、音乐分离、对话系统、环境音伪造检测、音频效果建模、关键词识别、水下声学分类、多模态人物识别、音频驱动视频生成以及说话人日志等多个方向。其中,一篇论文提出了针对语音认证和反欺骗系统的对抗攻击方法SMIA,揭示了现有防御的严重缺陷。
分析:
它包含了一篇关于“对抗攻击”的论文([replaced 004] Spectral Masking and Interpolation Attack (SMIA))。该论文描述了一种针对“语音认证与反欺骗系统”的“隐蔽对抗样本”生成方法,并指出其“高成功率”和“揭示现有静态防御的严重缺陷”,这直接符合高价值标准中的“技术攻防与供应链安全”维度,因为它涉及了AI系统的安全漏洞和攻防技术。
正文:
为方便阅读,详细内容已同步 github 仓库,欢迎 star~
https://github.com/advanced-cs/arXiv_daily
cs.SD; eess.AS
最新发布:10 篇
更新:5 篇
最新发布:
[new 001] On the Use of Self-Supervised Representation Learning for Speaker Diarization and Separation
简介: 该论文属于语音处理任务,聚焦说话人日志(diarization)与分离(separation)。针对现有自监督模型(如wav2vec2.0、WavLM)在这些任务上评估不足的问题,论文系统考察其表征质量,指出基准数据集多样性不足及下游系统覆盖不全等关键缺陷。
链接:
https://arxiv.org/pdf/2512.15224v1
备注: accepted at ASRU25
[new 002] A Conditioned UNet for Music Source Separation
简介: 该论文面向音乐源分离(MSS)任务,解决传统UNet需预设固定乐器词表、泛化性差的问题。提出条件化UNet模型QSCNet,通过音频查询实现任意目标声部提取,在MoisesDB数据集上超越Banquet,SNR提升超1dB且参数减半。
链接:
https://arxiv.org/pdf/2512.15532v1
[new 003] Audio MultiChallenge: A Multi-Turn Evaluation of Spoken Dialogue Systems on Natural Human Interaction
简介: 该论文提出Audio MultiChallenge基准,面向端到端语音对话系统,解决现有评测忽视自然多轮语音交互的问题。工作包括:扩展MultiChallenge框架至音频模态,新增Voice Editing和Audio-Cue挑战,构建452段真实多轮语音对话数据集,并评估模型在推理记忆、指令保持、自一致性及语音编辑鲁棒性上的表现。
链接:
https://arxiv.org/pdf/2512.14865v1
[new 004] BEAT2AASIST model with layer fusion for ESDD 2026 Challenge
简介: 该论文面向环境声音深度伪造检测(ESDD)任务,旨在识别被篡改的环境音频。提出BEAT2AASIST模型:扩展BEATs-AASIST,采用双分支处理频/通道分割特征,并引入top-k层融合(拼接、CNN门控、SE门控)及声码器数据增强,提升泛化性与鲁棒性。
链接:
https://arxiv.org/pdf/2512.15180v1
备注: 3 pages, 1 figure, challenge paper
[new 005] Time-Varying Audio Effect Modeling by End-to-End Adversarial Training
简介: 该论文属音频效果建模任务,旨在解决时间变异性硬件效果器(如phaser)在无控制信号下的黑盒建模难题。提出端到端GAN框架,含两阶段训练:先对抗学习调制分布,再监督微调同步内部状态,并设计 chirp-train 指标评估调制精度。
链接:
https://arxiv.org/pdf/2512.15313v1
备注: Submitted for review to the Journal of the Audio Engineering Society (JAES). Accompanying website:
https://ybourdin.github.io/sptvmod
[new 006] Synaspot: A Lightweight, Streaming Multi-modal Framework for Keyword Spotting with Audio-Text Synergy
简介: 该论文面向开放词汇关键词识别(KWS)任务,解决多模态模型参数大、难部署的问题。提出轻量级流式框架Synaspot:剥离语音注册中的说话人特征,融合音频与文本特征,并设计仅需编码器的数学解码机制,在保持高性能的同时大幅降低参数量。
链接:
https://arxiv.org/pdf/2512.15124v1
[new 007] Improving Underwater Acoustic Classification Through Learnable Gabor Filter Convolution and Attention Mechanisms
简介: 该论文面向水下声学目标分类任务,旨在解决噪声复杂、数据稀缺及环境变化导致模型泛化差的问题。提出GSE ResNeXt模型,融合可学习Gabor卷积与Squeeze-and-Excitation注意力机制,提升特征判别性与训练稳定性,在多任务上显著优于主流基准模型。
链接:
https://arxiv.org/pdf/2512.14714v1
[new 008] Adaptive Multimodal Person Recognition: A Robust Framework for Handling Missing Modalities
简介: 该论文面向多模态人物识别任务,解决现实场景中模态缺失或退化导致性能下降的问题。提出自适应三模态框架,融合语音、人脸、手势,采用多任务学习、跨模态注意力与置信度加权融合,显著提升缺失模态下的鲁棒性与准确率。
链接:
https://arxiv.org/pdf/2512.14961v1
备注: 10 pages and 8 tables
[new 009] TalkVerse: Democratizing Minute-Long Audio-Driven Video Generation
简介: 该论文面向音频驱动的长时 talking-video 生成任务,旨在解决现有方法依赖闭源数据、计算成本高、难以复现的问题。作者构建了开源大规模数据集 TalkVerse(230 万片段),并提出轻量级 5B DiT 基线模型,支持分钟级生成、零-shot 拍摄与语音重配音,显著降低推理开销。
链接:
https://arxiv.org/pdf/2512.14938v1
备注: open-sourced single-person full-body talking video generation dataset, training code and checkpoints
[new 010] O-EENC-SD: Efficient Online End-to-End Neural Clustering for Speaker Diarization
简介: 该论文提出O-EENC-SD,一种高效在线端到端说话人日志系统。任务是说话人日志(区分谁在何时说话),旨在解决现有在线方法计算开销大、依赖超参数等问题。工作包括:基于EEND-EDA构建在线框架,设计RNN拼接机制与新型质心精炼解码器,并通过消融验证有效性。
链接:
https://arxiv.org/pdf/2512.15229v1
更新:
[replaced 001] Sparse Autoencoders Make Audio Foundation Models more Explainable
简介: 该论文属可解释性研究任务,旨在解决音频基础模型表征难以理解的问题。作者用稀疏自编码器(SAEs)分析预训练模型隐层表示,在歌唱技巧分类案例中验证SAEs既能保留原始信息与标签,又能提升声学属性解耦,从而增强模型可解释性。
链接:
https://arxiv.org/pdf/2509.24793v2
备注: 5 pages, 5 figures, 1 table, submitted to ICASSP 2026
[replaced 002] Steering Language Model to Stable Speech Emotion Recognition via Contextual Perception and Chain of Thought
简介: 该论文面向语音情感识别(SER)任务,旨在解决大模型在SER中易产生幻觉、识别不稳定的问题。提出C²SER模型,融合Whisper与Emotion2Vec-S实现语义与声学感知,并引入显式到隐式思维链的自蒸馏机制,提升稳定性与准确性。
链接:
https://arxiv.org/pdf/2502.18186v2
备注: This work has been submitted to the IEEE TASLP for possible publication
[replaced 003] Single-channel speech enhancement by using psychoacoustical model inspired fusion framework
简介: 该论文属单通道语音增强任务,旨在解决噪声下语音质量与可懂度难以兼顾的问题。提出一种融合声学域(基于听觉心理模型的STSA估计器)和调制域(利用频率选择性)优势的框架,在提升语音质量的同时改善可懂度。
链接:
https://arxiv.org/pdf/2202.05272v2
备注: arXiv admin note: text overlap with arXiv
.04882
[replaced 004] Spectral Masking and Interpolation Attack (SMIA): A Black-box Adversarial Attack against Voice Authentication and Anti-Spoofing Systems
简介: 该论文提出SMIA攻击,属语音安全领域的对抗攻击任务,旨在突破语音认证与反欺骗系统。通过频谱掩蔽和插值技术,在人耳不可听频段扰动AI语音,生成高成功率(最高100%)的隐蔽对抗样本,揭示现有静态防御的严重缺陷。
链接:
https://arxiv.org/pdf/2509.07677v3
[replaced 005] Memo2496: Expert-Annotated Dataset and Dual-View Adaptive Framework for Music Emotion Recognition
简介: 该论文面向音乐情绪识别(MER)任务,旨在解决高质量标注数据稀缺与跨曲目特征漂移问题。作者构建了专家标注的Memo2496数据集,并提出DAMER框架,含双流注意力融合、渐进置信标注和风格锚定记忆学习三模块,显著提升 arousal 识别精度。
链接:
https://arxiv.org/pdf/2512.13998v2
主题分类:
技术攻防与供应链安全
新闻 4: arXiv 每日论文 20251218 | 自然语言处理
来源: 微信 - 自媒体
主题: AI模型安全、可靠性与攻防研究进展
摘要:
本期arXiv每日论文聚焦自然语言处理领域,涵盖了AI模型安全、可靠性与攻防的多个前沿研究。亮点包括针对多模态大模型毒性与偏见的神经元级去毒方法、大模型在核设施等安全关键场景的评估指标、葡萄牙语对抗性诗歌作为大模型越狱手段的发现、针对真实MCP服务器的LLM安全评估基准、RAG系统幻觉检测的局限性、以及量化LLM安全控制措施投入产出比的框架。此外,还有关于数据污染导致RL数学推理不可靠性、多语言机器遗忘基准、以及LLM指令遵循可靠性的研究。这些论文共同揭示了AI系统在安全性、鲁棒性及伦理方面面临的挑战与应对策略。
分析:
该新闻具有高价值。多篇论文直接涉及“高价值标准”中的多个维度。例如,[new 002] 提出“神经元级去毒”解决MLLM的“毒性、偏见及NSFW风险”;[new 011] 关注LLM在“安全关键场景(如医疗、核设施)”的“可靠性问题”,属于“关键基础设施与产业安全”;[new 018] 明确指出“对抗性诗歌”可作为“大模型越狱手段”,属于“技术攻防与供应链安全”;[new 025] 探讨“政治危机中公众情绪识别”,涉及“政治与意识形态安全”;[new 039] 提出“MCP-SafetyBench”基准,定义“20类跨层攻击类型”,评测LLM的“安全短板”,属于“技术攻防与供应链安全”;[new 041] 揭示RAG系统“幻觉检测”的“根本局限”,指出“不适用于生产级RAG”,对“关键基础设施与产业安全”构成潜在风险;[new 047] 提及“检测 jailbreak”作为模型可解释性应用,属于“技术攻防与供应链安全”;[replaced 023] 揭示RL数学推理中“数据污染”导致的“不可靠结果”和“数据泄露”,属于“技术攻防与供应链安全”;[replaced 024] 提及多模态模型评估中存在的“ethical issues that require retraction”,属于“社会影响与伦理风险”。这些内容均直接触及AI的潜在风险、安全漏洞及防御机制,对OSINT分析具有重要战略价值。
正文:
为方便阅读,详细内容已同步 github 仓库,欢迎 star~
https://github.com/advanced-cs/arXiv_daily
cs.CL
最新发布:60 篇
更新:30 篇
最新发布:
[new 001] An Empirical Study on Chinese Character Decomposition in Multiword Expression-Aware Neural Machine Translation
简介: 该论文属神经机器翻译任务,旨在解决中文多词表达(MWE)翻译难题。针对汉字无法直接套用西方子词技术(如BPE)的问题,系统研究汉字分解技术在MWE感知NMT中的作用,并通过实验验证其对语义表征与MWE翻译的提升效果。
链接:
https://arxiv.org/pdf/2512.15556v1
备注: capstone work, technical report, 27 pages, extraction from PhD thesis
https://doras.dcu.ie/26559/
[new 002] SGM: Safety Glasses for Multimodal Large Language Models via Neuron-Level Detoxification
简介: 该论文属多模态大模型安全干预任务,旨在解决MLLM因预训练数据污染导致的毒性、偏见及NSFW风险,尤其针对对抗性触发场景。提出SGM方法:白盒式神经元级软抑制,无需参数更新,显著降低毒性(48.2%→2.5%),保持生成质量与推理能力。
链接:
https://arxiv.org/pdf/2512.15052v1
备注: Under Review for ACL 2026
[new 003] CTkvr: KV Cache Retrieval for Long-Context LLMs via Centroid then Token Indexing
简介: 该论文属大模型推理优化任务,旨在解决长上下文下KV缓存内存开销大、检索效率低的问题。提出CTKVR方法:先用轻量质心索引粗筛,再令牌级精检;结合CPU-GPU协同优化系统,显著提升吞吐量且精度损失<1%。
链接:
https://arxiv.org/pdf/2512.15550v1
[new 004] Dual-Density Inference for Efficient Language Model Reasoning
简介: 该论文属大语言模型推理优化任务,旨在解决标准链式推理中中间步骤与答案使用相同语言密度导致的计算低效问题。提出Dual-Density框架(Denser),分离高密度符号化中间推理与低密度人类可读答案生成,显著降低token消耗(最高62%)并保持精度。
链接:
https://arxiv.org/pdf/2512.15358v1
[new 005] Activation Oracles: Training and Evaluating LLMs as General-Purpose Activation Explainers
简介: 该论文提出“激活预言机”(AOs),即训练LLM直接解释自身或其他LLM的隐藏层激活值。旨在解决LLM内部激活难以理解的问题,通过多样化自然语言问答训练,提升对未见任务、模型和知识的泛化解释能力,并在四项下游任务中超越或匹敌现有白/黑盒方法。
链接:
https://arxiv.org/pdf/2512.15674v1
备注: 36 pages
[new 006] ORACLE: Time-Dependent Recursive Summary Graphs for Foresight on News Data Using LLMs
简介: 该论文提出ORACLE系统,属新闻智能分析任务,旨在为高校提供周度决策洞察。它构建时间依赖的递归摘要图(TRSG),融合PESTEL分类、LLM摘要与变化检测,实现新闻数据的自动化、稳定化、主题化周报生成。
链接:
https://arxiv.org/pdf/2512.15397v1
[new 007] How Much is Too Much? Exploring LoRA Rank Trade-offs for Retaining Knowledge and Domain Robustness
简介: 该论文属模型适配任务,探究LoRA秩对知识保留与领域鲁棒性的影响。通过多数据集秩扫描实验,对比LoRA与全量微调在域内/域外Q&A及推理任务上的性能与遗忘现象,并分析表征与注意力变化。
链接:
https://arxiv.org/pdf/2512.15634v1
备注: Accepted at AACL IJCNLP 2025
[new 008] Parameter Efficient Multimodal Instruction Tuning for Romanian Vision Language Models
简介: 该论文属多模态指令微调任务,旨在解决罗马尼亚语视觉语言模型资源匮乏问题。作者构建罗马尼亚语Flickr30k及VQA数据集,采用LoRA高效微调LLaMA3.2、LLaVA1.6、Qwen2等开源VLM,显著提升其罗马尼亚语视觉问答与图像描述能力及语法正确性。
链接:
https://arxiv.org/pdf/2512.14926v1
[new 009] DASH: Dialogue-Aware Similarity and Handshake Recognition for Topic Segmentation in Public-Channel Conversations
简介: 该论文面向对话主题分割(DTS)任务,旨在解决公共信道(如海事VHF)中非正式、隐式话题转换导致的分割难题。提出LLM框架DASH-DTS,创新点包括握手识别判别话题转移、相似性引导示例选择、构造正负样本提升鲁棒性,并发布首个真实VHF数据集VHF-Dial。
链接:
https://arxiv.org/pdf/2512.15042v1
备注: Accepted by AAAIW2026
[new 010] Multiscale Aggregated Hierarchical Attention (MAHA): A Game Theoretic and Optimization Driven Approach to Efficient Contextual Modeling in Large Language Models
简介: 该论文属自然语言处理中的长文本建模任务,旨在解决MHSA二次复杂度导致的LLM长上下文扩展瓶颈。作者提出MAHA框架,通过可学习分层下采样与博弈论/优化驱动的多尺度注意力聚合,在保持全局依赖建模能力的同时,降低计算成本(4096长度下FLOPs减81%)。
链接:
https://arxiv.org/pdf/2512.14925v1
[new 011] Evaluating Metrics for Safety with LLM-as-Judges
简介: 该论文属AI安全评估任务,旨在解决LLM在安全关键场景(如医疗、核设施)中部署的可靠性问题。提出以LLM-as-Judges为评估框架,通过加权多指标、上下文感知错误分级和低一致性触发人工复核,提升评估鲁棒性。
链接:
https://arxiv.org/pdf/2512.15617v1
[new 012] Evaluating Large Language Models on Multimodal Chemistry Olympiad Exams
简介: 该论文属于多模态科学推理任务,旨在评估大语言模型在化学奥赛题上的图文联合推理能力。作者构建USNCO试题基准,系统评测40个MLLMs,发现其模态融合能力薄弱,甚至图文共存时性能下降;验证思维链提示可提升准确率与视觉定位能力,并提出改进方向。
链接:
https://arxiv.org/pdf/2512.14989v1
备注: Published at Communications Chemistry
[new 013] Well Begun, Half Done: Reinforcement Learning with Prefix Optimization for LLM Reasoning
简介: 该论文属大语言模型推理优化任务,针对RLVR方法均匀优化所有生成token导致效率低的问题,提出PPPO方法:基于“起始锁定效应”,聚焦前缀token优化,引入渐进前缀保留和续写累积奖励策略,在更少训练token下显著提升推理准确率。
链接:
https://arxiv.org/pdf/2512.15274v1
备注: Accepted by AAAI 2026
[new 014] The Moralization Corpus: Frame-Based Annotation and Analysis of Moralizing Speech Acts across Diverse Text Genres
简介: 该论文构建了多语种道德化语料库,提出基于框架的标注方案,用于识别和分析道德化言语行为中的道德价值、诉求与主体。任务属道德化检测与成分抽取,旨在解决其隐含性、主观性带来的NLP与人工标注难题,并评估LLM表现。
链接:
https://arxiv.org/pdf/2512.15248v1
[new 015] Toward expert-level motivational interviewing for health behavior improvement with LLMs
简介: 该论文属AI医疗对话任务,旨在解决MI心理咨询师稀缺、难以规模化的问题。研究构建中文MI对话数据集,微调三款开源LLM为MI-LLMs,并用自动指标与MITI专家编码评估,验证其具备接近真人MI的核心能力。
链接:
https://arxiv.org/pdf/2512.15446v1
备注: 26 pages, 3 figures
[new 016] Rakuten Data Release: A Large-Scale and Long-Term Reviews Corpus for Hotel Domain
简介: 该论文构建了涵盖2009–2024年、共730万条的日本乐天旅行酒店评论语料库,含多维结构化元数据。属数据资源建设任务,旨在解决酒店领域长期、大规模、细粒度评论数据稀缺问题,并分析2019–2024年间的数据漂移成因。
链接:
https://arxiv.org/pdf/2512.15151v1
[new 017] Bolmo: Byteifying the Next Generation of Language Models
简介: 该论文提出Bolmo,一种通过“字节化”现有子词模型构建的开源字节级语言模型。旨在解决字节级模型性能弱、训练成本高的问题,创新性地设计适配架构,实现高效知识蒸馏,仅用<1%预训练token预算即可转换,显著提升字符理解与编码能力,兼顾推理速度与实用性。
链接:
https://arxiv.org/pdf/2512.15586v1
[new 018] Adversarial versification in portuguese as a jailbreak operator in LLMs
简介: 该论文研究葡萄牙语对抗性诗歌(versification)作为大模型越狱手段的任务,旨在填补葡语安全评估空白。它指出将指令改写为诗歌可显著提升越狱成功率,揭示现有对齐方法过度依赖表层模式的缺陷,并呼吁构建适配葡语韵律特征的评测框架。
链接:
https://arxiv.org/pdf/2512.15353v1
备注: 15 pages
[new 019] From NLG Evaluation to Modern Student Assessment in the Era of ChatGPT: The Great Misalignment Problem and Pedagogical Multi-Factor Assessment (P-MFA)
简介: 该论文属教育技术与AI评估交叉任务,旨在解决ChatGPT时代学生评估失效问题——传统重结果、轻过程的评分方式已失准。作者提出Pedagogical Multi-Factor Assessment(P-MFA)模型,借鉴多因素认证逻辑,构建基于学习过程、多证据的新型评估框架。
链接:
https://arxiv.org/pdf/2512.15183v1
备注: IWCLUL 2025
[new 020] Integrating Large Language Models and Knowledge Graphs to Capture Political Viewpoints in News Media
简介: 该论文属自然语言处理中的政治观点分类任务,旨在提升新闻中政治立场识别的准确性。针对现有方法对观点语义与实体背景建模不足的问题,提出融合微调大语言模型与知识图谱(Wikidata)增强声明表征的新方法,并在英国移民议题基准上验证其有效性。
链接:
https://arxiv.org/pdf/2512.14887v1
[new 021] Beyond Majority Voting: Towards Fine-grained and More Reliable Reward Signal for Test-Time Reinforcement Learning
简介: 该论文属测试时强化学习任务,旨在解决多数投票伪标签导致的确认偏差与稀疏奖励问题。提出SCOPE框架:融合步级置信度加权伪标签估计,并通过动态子群划分与局部共识生成更细粒度、可靠的奖励信号。
链接:
https://arxiv.org/pdf/2512.15146v1
[new 022] DrugRAG: Enhancing Pharmacy LLM Performance Through A Novel Retrieval-Augmented Generation Pipeline
简介: 该论文属医疗AI任务,旨在提升LLM在药学执照类问答中的准确性。针对模型缺乏专业药学知识的问题,提出外部RAG框架DrugRAG,从权威源检索结构化药物知识并增强提示,无需修改模型。实验表明其显著提升多模型准确率(+7~21个百分点)。
链接:
https://arxiv.org/pdf/2512.14896v1
备注: 11 pages, 2 figures, 3 tables
[new 023] PPSEBM: An Energy-Based Model with Progressive Parameter Selection for Continual Learning
简介: 该论文面向持续学习任务,旨在解决自然语言处理中的灾难性遗忘问题。提出PPSEBM框架,融合能量模型(EBM)生成历史任务伪样本与渐进式参数选择(PPS)机制,为每任务分配专属参数,以兼顾知识保留与新任务适应。
链接:
https://arxiv.org/pdf/2512.15658v1
备注: 10 pages, 3 figures, 2025 IEEE International Conference on Big Data (BigData)
[new 024] Cross-Tokenizer Likelihood Scoring Algorithms for Language Model Distillation
简介: 该论文属语言模型知识蒸馏任务,解决师生模型 tokenizer 不一致导致的跨分词器似然计算难题。提出基于 BPE 递归结构的概率框架,支持子集/任意词汇映射,实现精确或高效近似似然评分,显著降低内存并提升性能。
链接:
https://arxiv.org/pdf/2512.14954v1
[new 025] When a Nation Speaks: Machine Learning and NLP in People's Sentiment Analysis During Bangladesh's 2024 Mass Uprising
简介: 该论文属情感分析任务,旨在解决孟加拉语在政治危机中公众情绪识别难题。研究构建了2028条标注新闻标题数据集(含Outrage/Hope/Despair三类),采用LDA挖掘主题,并验证语言特化模型优于多语言模型(XLM-RoBERTa 71%)。
链接:
https://arxiv.org/pdf/2512.15547v1
备注: Accepted in 2025 28th International Conference on Computer and Information Technology (ICCIT)
[new 026] You Never Know a Person, You Only Know Their Defenses: Detecting Levels of Psychological Defense Mechanisms in Supportive Conversations
简介: 该论文属心理语言学与NLP交叉任务,旨在自动检测支持性对话中求助者的心理防御机制水平。针对防御机制难标注、难建模的问题,作者构建了PsyDefConv对话语料库,并提出DMRS Co-Pilot四阶段预标注工具,提升标注效率与质量,同时发布基准结果与资源。
链接:
https://arxiv.org/pdf/2512.15601v1
备注: Under Review
[new 027] Why Your Academic Field Is Everywhere at Once: A Case Study of Arabic Linguistics
简介: 该论文属学科结构分析任务,旨在量化阿拉伯应用语言学的 thematic dispersion。作者用 Brookes 的 Δ 指标分析 1564 篇文献,发现 Δ=0.194,表明领域高度异质、无单一主导方向,计算语言学为主但非垄断,同时验证了方法的正确性与可复现性。
链接:
https://arxiv.org/pdf/2512.15328v1
[new 028] From Data to Dialogue: Unlocking Language for All
简介: 该论文属自然语言处理中的词汇表构建任务,旨在解决传统通用词表(如GSL/NGSL)主观性强、耗时久、泛化性差的问题。作者提出自动化构建面向特定语料的专用词表(SWL),实验证明其以更少词量达成95%文本覆盖率,更具实用性与可扩展性。
链接:
https://arxiv.org/pdf/2512.15552v1
[new 029] Characterizing Mamba's Selective Memory using Auto-Encoders
简介: 该论文属模型可解释性任务,旨在探究Mamba类SSM语言模型的“选择性遗忘”机制。它通过训练自编码器重构隐藏状态,量化不同token/序列的信息损失,发现数学符号、组织名和非标准英语更易被遗忘,并关联其在预训练数据中的低频性。
链接:
https://arxiv.org/pdf/2512.15653v1
备注: AACL 2025. Oral Presentation
[new 030] RFKG-CoT: Relation-Driven Adaptive Hop-count Selection and Few-Shot Path Guidance for Knowledge-Aware QA
简介: 该论文面向知识图谱问答(KGQA)任务,旨在缓解大模型因参数化知识局限导致的幻觉问题。提出RFKG-CoT方法:一是关系驱动的自适应跳数选择,动态调整推理步数;二是少样本路径引导的思维链提示,提升模型对KG路径的理解与利用。
链接:
https://arxiv.org/pdf/2512.15219v1
备注: 9pages, 5 figures, accepted by AAAI 2026
[new 031] Towards Proactive Personalization through Profile Customization for Individual Users in Dialogues
简介: 该论文属对话系统个性化任务,旨在解决LLM长期个性化难与冷启动问题。提出PersonalAgent,通过分解对话、序列化偏好推理,动态构建统一用户画像,实现跨会话一致的终身自适应个性化。
链接:
https://arxiv.org/pdf/2512.15302v1
[new 032] Learning inflection classes using Adaptive Resonance Theory
简介: 该论文属无监督学习任务,旨在建模语言使用者如何习得动词屈折类。作者用自适应共振理论(ART)对拉丁语、葡萄牙语和爱沙尼亚语词元聚类,通过调节警觉参数优化聚类效果,并验证所得类别与语言学描述的一致性。
链接:
https://arxiv.org/pdf/2512.15551v1
[new 033] Yes-MT's Submission to the Low-Resource Indic Language Translation Shared Task in WMT 2024
简介: 该论文面向WMT 2024低资源印度语言翻译任务,解决英-阿萨姆语、米佐语、卡西语、曼尼普尔语间翻译数据稀缺问题。作者尝试了多类方法:微调mT5/IndicBART/IndicTrans2(含LoRA)、LLM零/少样本提示(Llama 3、Mixtral)、LLM监督微调及从头训练Transformer,并用BLEU和chrF评估。
链接:
https://arxiv.org/pdf/2512.15226v1
备注: Accepted at WMT 2024
[new 034] T5Gemma 2: Seeing, Reading, and Understanding Longer
简介: 该论文提出T5Gemma 2,一种轻量级开源编码器-解码器多模态大模型,旨在解决长上下文理解、多语言与跨模态(视+读)联合建模问题。工作包括:基于Gemma 3的UL2适配扩展至多模态;引入词嵌入共享与合并注意力机制提升效率;发布270M至4B多规模预训练模型。
链接:
https://arxiv.org/pdf/2512.14856v1
备注: technical report
[new 035] FAME: Fictional Actors for Multilingual Erasure
简介: 该论文提出FAME基准,面向多语言机器遗忘任务,解决现有基准仅限英语、仅支持实体级遗忘的问题。工作包括构建含5种语言、1000个虚构演员资料及2万问答对的合成数据集,支持实体级与实例级遗忘评估。
链接:
https://arxiv.org/pdf/2512.15235v1
[new 036] The Meta-Prompting Protocol: Orchestrating LLMs via Adversarial Feedback Loops
简介: 该论文提出“元提示协议”,属AI系统工程任务,旨在解决LLM在关键应用中缺乏确定性保证的问题。通过构建生成器-审计员-优化器的对抗三元架构,将自然语言指令视为可微变量,用文本批评作梯度,抑制幻觉、防止模型崩溃,实现LLM的可编程自优化。
链接:
https://arxiv.org/pdf/2512.15053v1
备注: 6 pages, 2 figures
[new 037] Incentives or Ontology? A Structural Rebuttal to OpenAI's Hallucination Thesis
简介: 该论文属AI基础理论任务,挑战OpenAI将幻觉归因为激励错配的观点。作者论证幻觉是Transformer架构固有结构性缺陷——源于其无世界指涉的统计建模本质,并通过 Licensing Oracle 实验证明仅外部真值验证与拒答机制可根治幻觉。
链接:
https://arxiv.org/pdf/2512.14801v1
备注: 17 pages, references to prior work arXiv
.16297 and arXiv
.06073
[new 038] Evaluating LLMs for Zeolite Synthesis Event Extraction (ZSEE): A Systematic Analysis of Prompting Strategies
简介: 该论文属科学信息抽取任务,旨在评估大语言模型(LLMs)在沸石合成事件提取(ZSEE)中的性能。它系统比较四种提示策略在四个子任务上的效果,使用ZSEE数据集测试六种LLM,发现零样本表现接近先进策略,凸显模型在细粒度参数提取上的局限性。
链接:
https://arxiv.org/pdf/2512.15312v1
备注: Under Review
[new 039] MCP-SafetyBench: A Benchmark for Safety Evaluation of Large Language Models with Real-World MCP Servers
简介: 该论文提出MCP-SafetyBench,面向Model Context Protocol(MCP)场景的安全评估任务,解决现有基准无法覆盖真实MCP多服务器、多轮交互安全风险的问题;构建基于5类真实MCP服务器的基准,定义20类跨层攻击类型,并系统评测主流LLMs的安全短板。
链接:
https://arxiv.org/pdf/2512.15163v1
备注: Our benchmark is available at
https://github.com/xjzzzzzzzz/MCPSafety
[new 040] SynGP500: A Clinically-Grounded Synthetic Dataset of Australian General Practice Medical Notes
简介: 该论文提出SynGP500——一个由临床医生构建的500条合成澳大利亚全科医疗记录数据集。旨在解决真实GP数据稀缺、隐私受限及分布偏斜问题,通过融合RACGP课程、BEACH流行病学数据和真实临床复杂性(如错字、依从性差等),支持更泛化、合规的临床NLP模型研发与评估。
链接:
https://arxiv.org/pdf/2512.15259v1
备注: 16 pages, 2 figures
[new 041] The Semantic Illusion: Certified Limits of Embedding-Based Hallucination Detection in RAG Systems
简介: 该论文属RAG系统幻觉检测任务,旨在揭示嵌入式方法在识别语义合理但事实错误的幻觉时的根本局限。作者用共形预测提供统计保证,实证发现主流嵌入模型在真实基准上误报率极高,而GPT-4判别效果显著更好,提出“语义幻觉”概念,指出嵌入法不适用于生产级RAG。
链接:
https://arxiv.org/pdf/2512.15068v1
备注: 12 pages, 2 figures, 6 tables
[new 042] Quantifying Return on Security Controls in LLM Systems
简介: 该论文属安全评估任务,旨在量化LLM系统中安全控制措施的投入产出比。针对RAG服务,它构建框架将攻击成功率与 breach 成本结合,通过蒙特卡洛模拟计算预期损失和回报率(RoC),对比ABAC、NER红action、NeMo Guardrails三类控制效果。
链接:
https://arxiv.org/pdf/2512.15081v1
备注: 13 pages, 9 figures, 3 tables
[new 043] Revisiting the Reliability of Language Models in Instruction-Following
简介: 该论文聚焦指令遵循的“细微差异可靠性”任务,旨在解决LLM在用户表述微变时性能骤降的问题。作者提出可靠率指标reliable@k,构建数据增强生成的IFEval++基准,评估20+26个模型,发现性能最大下降61.8%,并探索改进方法。
链接:
https://arxiv.org/pdf/2512.14754v1
备注: Preprint
[new 044] DreamPRM-Code: Function-as-Step Process Reward Model with Label Correction for LLM Coding
简介: 该论文属代码生成评估任务,旨在解决现有PRM在编程中因步骤划分不清和蒙特卡洛标签噪声导致效果差的问题。提出DreamPRM-Code:以函数为推理步,用Chain-of-Function prompting实现模块化生成,并引入元学习标签校正机制提升中间步骤评分准确性。
链接:
https://arxiv.org/pdf/2512.15000v1
[new 045] Prompt Repetition Improves Non-Reasoning LLMs
简介: 该论文属提示工程任务,旨在提升非推理型大语言模型性能。发现重复输入提示可显著提高Gemini、GPT等模型表现,且不增加生成长度或延迟。通过实证验证该简单策略的有效性。
链接:
https://arxiv.org/pdf/2512.14982v1
[new 046] SoMe: A Realistic Benchmark for LLM-based Social Media Agents
简介: 该论文提出SoMe基准,旨在评估LLM驱动的社交媒体智能体在真实场景下的综合能力。针对现有评估缺失、任务不全面的问题,构建了含8类任务、千万级数据与近1.8万标注查询的高质量基准,并实证分析主流模型局限,推动社交媒体智能体发展。
链接:
https://arxiv.org/pdf/2512.14720v1
备注: Accepted by AAAI 2026
[new 047] Predictive Concept Decoders: Training Scalable End-to-End Interpretability Assistants
简介: 该论文提出“预测性概念解码器(PCD)”,属神经网络可解释性任务,旨在自动发现激活中与行为相关的语义概念。通过端到端训练编码器(压缩激活为稀疏概念列表)和解码器(基于概念回答自然语言问题),实现可扩展、可泛化的模型行为解释,并在检测 jailbreak、隐式提示等任务上验证有效。
链接:
https://arxiv.org/pdf/2512.15712v1
备注: 28 pages, 12 figures
[new 048] HERO: Hierarchical Traversable 3D Scene Graphs for Embodied Navigation Among Movable Obstacles
简介: 该论文属具身导航任务,解决静态场景图无法处理可移动障碍物导致的可达性差问题。提出 HERO 框架,构建分层可通行3D场景图,将可操作障碍物建模为可穿越路径,提升导航效率与可达性。
链接:
https://arxiv.org/pdf/2512.15047v1
[new 049] NoveltyRank: Estimating Conceptual Novelty of AI Papers
简介: 该论文提出NoveltyRank,旨在自动评估AI论文的概念新颖性。属自然语言处理中的文本新颖性建模任务,解决人工评审 novelty 判定低效、主观问题。工作包括构建二分类(绝对新颖)和 pairwise 比较(相对新颖)两种任务,基于Qwen3-4B、SciBERT等模型微调,并与GPT-5.1对比分析。
链接:
https://arxiv.org/pdf/2512.14738v1
[new 050] Tracking Temporal Dynamics of Vector Sets with Gaussian Process
简介: 该论文属时序向量集建模任务,旨在解决动态向量集合(如犯罪分布、词嵌入)的结构演化分析难题。提出基于高斯过程与随机傅里叶特征的方法,将各时刻向量集映射为紧凑可比的低维表示,实现其时间演化追踪与可视化。
链接:
https://arxiv.org/pdf/2512.15538v1
备注: Work in Progress
[new 051] LLM as a Neural Architect: Controlled Generation of Image Captioning Models Under Strict API Contracts
简介: 该论文提出NN-Caption,用LLM指导神经架构搜索(NAS),在严格API约束下自动生成可运行的图像描述模型。它组合CNN编码器与序列解码器,生成、训练并评估数十种新模型,提升AutoML与可复现基准研究。
链接:
https://arxiv.org/pdf/2512.14706v1
[new 052] VTCBench: Can Vision-Language Models Understand Long Context with Vision-Text Compression?
简介: 该论文提出VTCBench基准,评估视觉语言模型(VLMs)在视觉-文本压缩(VTC)下的长上下文理解能力。针对VTC虽提升效率但损害长程依赖建模的问题,设计三大任务:检索、推理与记忆,并评测主流模型,揭示其在VTC下长上下文理解显著退化。
链接:
https://arxiv.org/pdf/2512.15649v1
[new 053] Effectively Detecting and Responding to Online Harassment with Large Language Models
简介: 该论文属NLP应用任务,旨在解决私密消息(Instagram)中在线骚扰的检测与响应问题。工作包括:人工标注骚扰数据、构建LLM自动标注流水线并评估其准确性、生成并评估LLM模拟回复,结果表明其检测有效且回复比人工更助人。
链接:
https://arxiv.org/pdf/2512.14700v1
备注: 16 pages, 2 figures
[new 054] ChatGPT and Gemini participated in the Korean College Scholastic Ability Test -- Earth Science I
简介: 该论文属教育测评与AI能力分析任务,旨在评估GPT-4o、Gemini等大模型在韩国高考地球科学试题中的表现,揭示其感知—认知脱节、计算—概念分离等缺陷,并据此设计AI抗性考题,保障学术诚信与评估公平。
链接:
https://arxiv.org/pdf/2512.15298v1
备注: 23 pages, 9 tables, 1 figure
[new 055] Emotion Recognition in Signers
简介: 该论文属多模态情感识别任务,旨在解决手语者情感识别中语法与情感面部表达重叠、数据稀缺两大挑战。作者构建日语手语数据集eJSL,结合英手语数据集BOBSL,提出跨语言方法,验证文本情绪识别迁移、时序片段选择及手部运动建模的有效性,并建立强基线。
链接:
https://arxiv.org/pdf/2512.15376v1
[new 056] SepsisSuite: Beyond Risk Stratification -- A Comparative Analysis of Deep Fusion vs. Expert Stacking for Prescriptive Sepsis AI
简介: 该论文聚焦脓毒症的预测与抗生素处方决策任务,旨在解决多模态数据融合效果差、模型过拟合及临床实用性不足问题。提出SepsisLateFusion(上下文感知专家堆叠)和Quad-Modal Ensemble等新架构,在MIMIC-IV上实现SOTA预测性能(0.915 AUC)与处方支持,并开源部署框架SepsisSuite。
链接:
https://arxiv.org/pdf/2512.14712v1
备注: 7 Pages, 4 Tables, 9 Figures
[new 057] Audio MultiChallenge: A Multi-Turn Evaluation of Spoken Dialogue Systems on Natural Human Interaction
简介: 该论文提出Audio MultiChallenge基准,面向端到端语音对话系统,解决现有评测忽视自然多轮语音交互的问题。工作包括:扩展MultiChallenge框架至音频模态,新增Voice Editing和Audio-Cue挑战,构建452段真实多轮语音对话数据集,并评估模型在推理记忆、指令保持、自一致性及语音编辑鲁棒性上的表现。
链接:
https://arxiv.org/pdf/2512.14865v1
[new 058] Explaining the Reasoning of Large Language Models Using Attribution Graphs
简介: 该论文属可解释性AI任务,旨在解决大语言模型(LLM)推理过程不透明问题。提出CAGE框架,构建保持因果性与行随机性的归因图,建模提示与各代生成 token 的动态影响关系,通过路径边际化提升上下文归因的保真度。
链接:
https://arxiv.org/pdf/2512.15663v1
[new 059] From Isolation to Entanglement: When Do Interpretability Methods Identify and Disentangle Known Concepts?
简介: 该论文属可解释性研究,旨在检验稀疏自编码器等方法能否真正识别并解耦因果相关概念(如情感、领域)。作者构建多概念相关性可控的文本数据集,评估特征解耦性与独立可操控性,发现传统相关性指标不足以保证概念独立操控。
链接:
https://arxiv.org/pdf/2512.15134v1
[new 060] Task Matrices: Linear Maps for Cross-Model Finetuning Transfer
简介: 该论文提出“任务矩阵”,即从预训练到微调模型的线性映射,旨在验证跨模型微调中存在通用线性编码。它在视觉与语言模型、10个数据集上验证:仅添加任务矩阵即可逼近全量微调性能,优于线性探针,支持高效可迁移的适配。
链接:
https://arxiv.org/pdf/2512.14880v1
备注: NeurIPS Unireps 2025
更新:
[replaced 001] Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation
简介: 该论文提出“多模态解题解释”任务,旨在解决大模型在教育中缺乏视觉辅助解释能力的问题。作者构建了含1000道题的ME2基准数据集,标注视觉关键点(如辅助线、角度)及对应文本解释,并实验证明当前LLM在视觉定位与关键点驱动解释上表现薄弱。
链接:
https://arxiv.org/pdf/2504.03197v5
备注: 14 pages, 9 figures
[replaced 002] Steering Language Model to Stable Speech Emotion Recognition via Contextual Perception and Chain of Thought
简介: 该论文面向语音情感识别(SER)任务,旨在解决大模型在SER中易产生幻觉、识别不稳定的问题。提出C²SER模型,融合Whisper与Emotion2Vec-S实现语义与声学感知,并引入显式到隐式思维链的自蒸馏机制,提升稳定性与准确性。
链接:
https://arxiv.org/pdf/2502.18186v2
备注: This work has been submitted to the IEEE TASLP for possible publication
[replaced 003] Designing LLMs for cultural sensitivity: Evidence from English-Japanese translation
简介: 该论文研究LLM在英日邮件翻译中的文化敏感性问题,属跨文化自然语言生成任务。通过对比三种提示策略(朴素、受众导向、规范指导),结合语言模式分析与母语者评估,验证文化适配提示可提升翻译的文化适宜性,并提出包容性LLM设计建议。
链接:
https://arxiv.org/pdf/2509.11921v2
备注: Posted premature without permission of all authors
[replaced 004] Hidden in the Haystack: Smaller Needles are More Difficult for LLMs to Find
简介: 该论文研究LLM在“海中寻针”任务中的性能瓶颈,聚焦被忽略的“金文长度”(gold context size)影响。通过跨领域、多模型、15万+实验,发现更短金文显著降低准确率并加剧位置偏差,且该效应独立于其他混淆因素。
链接:
https://arxiv.org/pdf/2505.18148v2
备注: Under Review
[replaced 005] Accelerating Mobile Language Model via Speculative Decoding and NPU-Coordinated Execution
简介: 该论文面向移动端RAG任务,解决NPU因静态图与相位切换导致的低效问题。提出sd.npu框架:用流水线执行掩蔽图切换开销,结合NPU-centric投机解码提升解码阶段硬件利用率,显著加速并节能。
链接:
https://arxiv.org/pdf/2510.15312v4
[replaced 006] Feel the Difference? A Comparative Analysis of Emotional Arcs in Real and LLM-Generated CBT Sessions
简介: 该论文属心理健康NLP任务,旨在评估LLM生成CBT对话的情感真实性。作者构建真实对话数据集RealCBT,提出基于情绪三维度(效价、唤醒、支配)的细粒度情感弧分析框架,对比发现合成对话在情感变异性、语言情感强度及调节模式上显著偏离真实会话。
链接:
https://arxiv.org/pdf/2508.20764v3
备注: Accepted at 2025 EMNLP findings,19 page,2 figures
[replaced 007] May I have your Attention? Breaking Fine-Tuning based Prompt Injection Defenses using Architecture-Aware Attacks
简介: 该论文属于AI安全任务,旨在评估细调型提示注入防御机制的鲁棒性。针对SecAlign等白盒防御,提出架构感知的注意力优化攻击,成功率达85–95%,揭示其安全性缺陷,并开源代码。
链接:
https://arxiv.org/pdf/2507.07417v2
[replaced 008] Knowledge Editing with Subspace-Aware Key-Value Mappings
简介: 该论文属知识编辑任务,旨在解决大模型事实错误修正中编辑扰动大、知识遗忘严重的问题。提出SUIT方法,通过识别并仅修改MLP层中与编辑相关的关键子空间的键值映射,在保持高编辑成功率的同时显著提升原始知识保留能力。
链接:
https://arxiv.org/pdf/2509.24502v2
备注: 25 pages, 12 figures, 10 tables
[replaced 009] MMGR: Multi-Modal Generative Reasoning
简介: 该论文提出MMGR评估框架,旨在解决视频/图像生成模型缺乏推理能力的问题。它从物理、逻辑、3D/2D空间、时间五方面评测生成式模型在抽象推理、具身导航、物理常识三类任务中的多模态生成推理能力,并揭示当前模型重感知轻因果、弱全局一致等缺陷。
链接:
https://arxiv.org/pdf/2512.14691v2
备注: work in progress
[replaced 010] LaF-GRPO: In-Situ Navigation Instruction Generation for the Visually Impaired via GRPO with LLM-as-Follower Reward
简介: 该论文属导航指令生成任务,旨在为视障人士生成精准、实时、安全的在地化步进指令。提出LaF-GRPO方法,用大模型模拟视障用户反馈作为奖励,优化视觉语言模型;构建开源数据集NIG4VI(27k样本),实验证明其显著提升BLEU、METEOR等指标及指令实用性。
链接:
https://arxiv.org/pdf/2506.04070v3
备注: Accepted at AAAI-26
[replaced 011] Artificial Hippocampus Networks for Efficient Long-Context Modeling
简介: 该论文属长上下文建模任务,旨在解决Transformer长序列推理的高计算与内存开销问题。提出人工海马网络(AHN),结合滑动窗口注意力与可学习压缩模块,实现高效长上下文建模。通过自蒸馏训练和稀疏激活,在显著降本同时提升性能。
链接:
https://arxiv.org/pdf/2510.07318v2
备注: Code:
https://github.com/ByteDance-Seed/AHN
[replaced 012] DenoiseRotator: Enhance Pruning Robustness for LLMs via Importance Concentration
简介: 该论文属模型压缩任务,旨在提升大语言模型剪枝鲁棒性。针对剪枝后性能显著下降(尤其半结构化稀疏下)的问题,提出DenoiseRotator方法:通过可学习正交变换重分布权重重要性,降低重要性熵值,使重要性更集中,再与现有剪枝法(如SparseGPT)协同使用,显著减小性能退化。
链接:
https://arxiv.org/pdf/2505.23049v2
备注: Accepted at NeurIPS 2025
[replaced 013] GAPS: A Clinically Grounded, Automated Benchmark for Evaluating AI Clinicians
简介: 该论文提出GAPS框架,用于自动化、临床指南驱动的AI医生评测。旨在解决现有基准主观、低扩展性及脱离临床实际的问题。工作包括构建多维评估范式(Grounding/Adequacy/Perturbation/Safety)、全自动证据驱动题库生成与评分 pipeline,并发布NSCLC基准数据集与代码。
链接:
https://arxiv.org/pdf/2510.13734v2
[replaced 014] Cooperative Retrieval-Augmented Generation for Question Answering: Mutual Information Exchange and Ranking by Contrasting Layers
简介: 该论文属多跳/简单问答任务,旨在解决RAG中检索错误与幻觉问题。提出CoopRAG框架:通过子问题分解与推理链掩码增强检索;利用检索器层间对比重排序文档;再由LLM填充掩码完成推理。在多个QA数据集上显著提升检索与答案质量。
链接:
https://arxiv.org/pdf/2512.10422v3
备注: Accepted to NeurIPS 2025
[replaced 015] Scale-invariant Attention
简介: 该论文属大语言模型长上下文建模任务,旨在解决注意力机制在短上下文训练后难以泛化到长上下文推理的问题。提出尺度不变注意力,通过位置相关logits变换满足总注意力与稀疏性尺度不变,并验证其在零样本长上下文泛化和检索中的有效性。
链接:
https://arxiv.org/pdf/2505.17083v2
备注: Accepted at Neurips 2025
[replaced 016] LATTE: Learning Aligned Transactions and Textual Embeddings for Bank Clients
简介: 该论文属金融领域客户表征学习任务,旨在解决用LLM处理长银行事件序列计算昂贵、难部署的问题。提出LATTE框架:将行为特征压缩为短提示,经冻结LLM编码后,与原始事件嵌入做对比学习,显著降本提效。
链接:
https://arxiv.org/pdf/2508.10021v4
[replaced 017] Learning without training: The implicit dynamics of in-context learning
简介: 该论文研究大语言模型(LLM)的上下文学习机制,旨在解释其“无需训练即可学习”的现象。作者理论结合实验,揭示Transformer块中自注意力与MLP层协同作用,能将输入上下文隐式转化为MLP权重的低秩更新,从而实现推理时的快速适应。
链接:
https://arxiv.org/pdf/2507.16003v2
[replaced 018] 3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model
简介: 该论文面向具身智能任务,解决LLM在动态3D环境中长期时空记忆建模不足的问题。提出3DMem-Bench基准和3DLLM-Mem模型,通过工作记忆查询与选择性融合 episodic 记忆,提升长程空间-时间推理与动作规划能力。
链接:
https://arxiv.org/pdf/2505.22657v2
备注: demos at:
https://3dllm-mem.github.io
[replaced 019] SemShareKV: Efficient KVCache Sharing for Semantically Similar Prompts via Token-Level LSH Matching
简介: 该论文属LLM推理优化任务,旨在解决语义相似但词形不同的提示间KV缓存无法共享的问题。提出SemShareKV框架,利用LSH对token嵌入进行模糊匹配,并融合RoPE保留位置信息,实现跨提示的语义级KV缓存复用,显著提升推理速度与内存效率。
链接:
https://arxiv.org/pdf/2509.24832v2
备注: 11 figures, 14pages
[replaced 020] VLegal-Bench: Cognitively Grounded Benchmark for Vietnamese Legal Reasoning of Large Language Models
简介: 该论文构建了首个面向越南法律的、认知分层的评测基准VLegal-Bench,旨在解决现有LLM在越南法律理解与应用上缺乏系统评估的问题。工作包括:基于布鲁姆分类法设计多层级任务,由法律专家标注10450个样本,覆盖问答、检索增强生成、多步推理等真实场景。
链接:
https://arxiv.org/pdf/2512.14554v2
[replaced 021] Thinking on the Fly: Test-Time Reasoning Enhancement via Latent Thought Policy Optimization
简介: 该论文属大语言模型推理增强任务,旨在解决隐式潜思考在难例和分布外任务中鲁棒性差的问题。提出无参数的测试时方法LTPO,将潜思考向量视为可优化变量,用LLM自身置信度奖励在线策略优化,显著提升复杂推理(如AIME)性能。
链接:
https://arxiv.org/pdf/2510.04182v3
[replaced 022] From Signal to Turn: Interactional Friction in Modular Speech-to-Speech Pipelines
简介: 该论文属人机交互与AI系统设计任务,聚焦语音AI对话不自然问题。通过分析模块化S2S-RAG系统,识别出三类结构性交互摩擦:时间错位、表达扁平化、修复僵化,并指出其源于模块化架构对控制的优先权,主张优化接口协同而非单点性能。
链接:
https://arxiv.org/pdf/2512.11724v2
备注: 6 pages, 1 figure
[replaced 023] Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination
简介: 该论文属AI模型评估任务,旨在解决RL数学推理研究中因数据污染导致结论不可靠的问题。作者发现Qwen2.5在MATH等基准上存在预训练数据泄露,遂构建无污染的RandomCalculation数据集,实证表明仅正确奖励信号能稳定提升性能,驳斥了随机奖励有效的错误结论。
链接:
https://arxiv.org/pdf/2507.10532v3
备注: 28 pages, AAAI 2026
[replaced 024] MINED: Probing and Updating with Multimodal Time-Sensitive Knowledge for Large Multimodal Models
简介: 该论文属多模态模型时间感知评估与知识更新任务,旨在解决大模型对时序知识理解弱、缺乏动态评测基准的问题。作者构建了MINED时间敏感知识基准(2104样本、6维度、11任务),评测15个LMMs,并验证知识编辑可有效更新其时序知识。
链接:
https://arxiv.org/pdf/2510.19457v3
备注: Due to the fact that this paper was completed without informing the mentor, there are ethical issues that require retraction. We hope for your understanding
[replaced 025] EvoLattice: Persistent Internal-Population Evolution through Multi-Alternative Quality-Diversity Graph Representations for LLM-Guided Program Discovery
简介: 该论文提出EvoLattice框架,解决LLM程序演化中单候选覆盖、结构脆弱与多样性缺失问题。它用有向无环图统一表示多候选程序/智能体行为,节点存多替代方案,路径定义可执行个体;支持细粒度评估、LLM驱动的变异重组,并保障结构正确性。
链接:
https://arxiv.org/pdf/2512.13857v2
[replaced 026] Efficient Adaptive Rejection Sampling for Accelerating Speculative Decoding in Large Language Models
简介: 该论文属LLM推理加速任务,旨在解决投机解码中因固定阈值导致的“随机拒绝”问题。提出EARS方法,动态依据目标模型预测不确定性(1−max(P))自适应调整接受阈值,在不确定时放宽标准、确定时严格把关,提升吞吐量且几乎不损精度。
链接:
https://arxiv.org/pdf/2512.13194v3
[replaced 027] TaP: A Taxonomy-Guided Framework for Automated and Scalable Preference Data Generation
简介: 该论文属于大语言模型数据构建任务,旨在解决多语言偏好数据集构建成本高、英文主导的问题。提出TaP框架,基于结构化分类法自动、可扩展地生成高质量多语言偏好数据,并验证其在监督与偏好微调中显著优于现有开源数据集。
链接:
https://arxiv.org/pdf/2506.23979v3
备注: 33 pages, 16 tables, 10 figures
[replaced 028] DiscoX: Benchmarking Discourse-Level Translation task in Expert Domains
简介: 该论文针对专家领域篇章级翻译评估不足的问题,提出DiscoX基准(含200篇跨学科长文本)和无参考评估指标Metric-S,揭示当前大模型仍显著落后于人类专家,推动专业级机器翻译发展。
链接:
https://arxiv.org/pdf/2511.10984v2
备注: 36 pages
[replaced 029] aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists
简介: 该论文提出aiXiv平台,属AI科研基础设施构建任务;旨在解决AI生成科研内容缺乏适配、可信、开放发布渠道的问题;设计多智能体架构,支持人机协同投稿、评审与迭代优化,并提供API/MCP接口,实现可扩展的开放科学生态。
链接:
https://arxiv.org/pdf/2508.15126v2
备注: Preprint under review. Code is available at
https://github.com/aixiv-org. Website is available at
https://aixiv.science
[replaced 030] Confucius Code Agent: Scalable Agent Scaffolding for Real-World Codebases
简介: 该论文提出Confucius Code Agent(CCA),面向真实大规模代码库的软件工程任务,解决现有编码代理在可扩展性、长程推理、工具协同与可控性上的不足。工作包括:构建Confucius SDK(含分层记忆、持续笔记、模块化扩展)和元代理自动调优机制,并在SWE-Bench-Pro上验证有效性。
链接:
https://arxiv.org/pdf/2512.10398v4
备注: The latest version
主题分类:
技术攻防与供应链安全
新闻 5: 本田停产5天!芯片卡脖子,销量滑铁卢,日系车要退出中国?
来源: 微信 - 自媒体
主题: 本田因芯片短缺停产及其在华市场困境,凸显全球芯片供应链受AI需求影响和车企转型挑战。
摘要:
本田因全球半导体短缺,特别是AI数据中心对芯片产能的虹吸效应,宣布其中国工厂停产5天,日本工厂也受影响。这导致本田2026财年利润预计大幅缩水,且其在华销量持续下滑,新能源转型缓慢。文章指出,本田过度依赖海外芯片供应链,未能及时转向国产替代,面临系统性危机。
分析:
它明确指出“全球芯片产能都被AI数据中心‘虹吸’了”和“AI抢产能”,导致本田面临“芯片卡脖子”和“出口管制”下的“供应链中断”风险。这符合高价值标准中“技术攻防与供应链安全”维度。
正文:
开年大戏提前上演,本田居然要给中国工厂“放长假”了!
12月17日本田官宣,12月29日起广汽本田合资工厂直接停产5天,日本本土工厂明年1月也得停2天+减产3天,理由还是老掉牙的“半导体短缺”——这波操作到底是芯片背锅,还是本田自身难保?
划重点:
这可不是小打小闹的产能调整!
本田从10月就开始“渡劫”,墨西哥工厂直接停摆,美加工厂被迫减产,当时就说是中国控股的荷兰安世半导体受出口管制闹的幺蛾子
现在轮到中国工厂遭殃,虽说没明说是不是还跟安世有关,但明眼人都看得出来,全球芯片荒这把火,终究还是烧到了本田的大本营!
更扎心的是,这波停产直接戳中了本田的命门!
财报早就预警,2026财年营业利润要缩水1500亿日元,折合人民币68亿元,相当于白扔了几十个小目标,罪魁祸首就是芯片短缺导致的产量不达标
可别以为只是芯片的锅,本田在华的日子早就不好过了!
东风本田连续四年销量下滑,前11个月暴跌24.6%,曾经的爆款CR-V、思域风光不再,电动SUV S7上市40天降价6万,首月才卖52辆,简直惨到不忍直视。
为啥芯片荒对本田影响这么大?
要知道现在智能汽车就是“移动芯片盒”,传统燃油车要600-700颗芯片,电动车直接翻倍到1600颗,智能车更是要3000颗起步
而全球芯片产能都被AI数据中心“虹吸”了,三星、美光这些巨头把40%以上产能都给了数据中心,消费级芯片直接被挤到角落,价格还飙涨35% 。
本田一边没搞定芯片供应链,一边新能源转型慢半拍,新能源车渗透率连行业均值的一半都不到,这不就是“两头不讨好”吗?
有人说“芯片荒是暂时的”,但本田的危机明明是系统性的!
这边东风本田发动机工厂刚摘了“东风HONDA”的招牌,换成广汽本田的logo,股权变更背后是燃油车守不住、新能源车起不来的双重困境;
那边承诺2025年80%新车是新能源,结果销量连5000辆的行业均值都达不到,纯电工厂建成了却闲置产能。
现在又被芯片卡脖子,停产只是导火索,真正的问题是本田已经跟不上中国汽车市场的节奏了!
再看国产芯片的进展,车规级MCU、功率芯片早就实现自主生产,国内车企都在疯狂切换国产替代供应链
偏偏本田还在依赖海外芯片,遇上出口管制、AI抢产能的双重暴击,可不就只能被动停产?
这就像别人都在换5G手机,你还抱着功能机等4G信号,被淘汰只是时间问题!
说到底,本田这波停产与其说是芯片惹的祸,不如说是自身转型滞后的必然结果。
芯片短缺是行业通病,但为啥自主品牌能逆势增长?
因为人家早就在国产化供应链上未雨绸缪了。
本田要是还抱着老思路,一边依赖海外芯片,一边在新能源上磨磨蹭蹭,别说68亿利润缩水,未来能不能保住中国市场份额都难说!
你觉得本田停产是芯片背锅,还是自身竞争力不行?
主题分类:
技术攻防与供应链安全
新闻 6: 美国终于摊牌了!国家安全战略,藏着一把对准中国的“软刀子”!
来源: 今日头条 - 自媒体
主题: 美国国家安全战略对华技术封锁与产业链竞争,尤其聚焦人工智能等前沿技术领域。
摘要:
美国发布《国家安全战略报告》,将中国列为“头号关注对象”,其“负责任竞争”策略实则通过“技术封锁和产业链‘卡脖子’”对中国施加“软刀子”影响。报告意图将中国排除在高端制造、人工智能等未来关键领域的技术联盟和全球产业链核心之外,迫使中国发展自主核心技术以应对挑战。
分析:
它明确指出美国国家安全战略中包含对中国进行“技术封锁和产业链‘卡脖子’”的策略,并具体提及了“人工智能”这一“决定未来的赛道”。这符合高价值标准中“技术攻防与供应链安全”维度,即涉及“芯片/算法的‘封锁’、‘断供’、‘制裁’及‘供应链中断’”。
正文:
老铁们,最近美国那边又出了一份“期末大考”成绩单——《国家安全战略报告》。听着挺官方,但说白了,就是美国未来几年打算怎么跟全世界“打交道”的行动指南。而这份指南里,中国被放在了最显眼的位置,堪称“头号关注对象”。
那美国到底想干啥?它明面上说了,不搞新冷战,要跟咱们“负责任地竞争”。这话听着是不是挺客气?但咱得扒开糖衣看看里面的药丸。这根本不是要跟你掰手腕,而是想用一种更隐蔽的方式,给你下“软刀子”。
这“软刀子”是啥?就是技术封锁和产业链“卡脖子”。以前是直接断供芯片,现在玩得更高级了。它想拉着一帮小兄弟,搞个“排华小圈子”,从最底层的规则、标准、技术联盟上就把你排除在外。比如高端制造、人工智能这些决定未来的赛道,它就想砌起一堵高墙,让你只能在墙外干着急。
这招狠就狠在,它不是跟你硬碰硬,而是想让你“缺氧”。没有了最前沿的技术交流,没有了全球产业链的核心位置,发展速度自然就慢下来了。这才是真正的阳谋,比航母开到家门口还让人头疼。
那我们该怎么办?怕是肯定不怕的。别人想关上门,我们就得自己造钥匙。别人搞小圈子,我们就得把朋友圈做得更大、更开放。说白了,这就像一场马拉松,有人想在半路给你挖坑,但你不能停下来跟他吵架,你唯一的办法就是跑得更快,让他连你的车尾灯都看不见。
所以啊,这份报告虽然来者不善,但也给我们提了个醒:核心技术是买不来、求不来的。真正的安全感,永远是自己给的。把自家的活儿练扎实了,任凭风浪起,稳坐钓鱼台!
主题分类:
技术攻防与供应链安全
新闻 7: Rust + AI正在悄悄干掉Python最大的优势(大多数开发者还没意识到
来源: 微信 - 自媒体
主题: Rust在AI生产环境中的崛起及其对Python的替代趋势
摘要:
新闻指出,尽管Python因其易用性仍是AI原型开发的首选,但Rust正悄然在AI生产环境中取代Python。原因在于Rust提供了显著更高的性能、内存安全性和可靠性,解决了Python在规模化部署中的性能瓶颈和不可预测性。大型科技公司如Cloudflare、Hugging Face和Microsoft已在其核心AI组件中广泛采用Rust,以应对内存安全漏洞并实现更高效、稳定的AI服务。
分析:
该新闻具有高价值。文章明确指出,Rust在AI生产环境中被采用,以解决Python在规模化部署中的“性能瓶颈”和“内存安全问题”。特别是,微软内部报告显示“约70%的安全漏洞都是内存安全问题”,并因此大力推广Rust,这直接关系到AI系统的“技术攻防”和“供应链安全”,因为它涉及通过选择更安全的编程语言来预防潜在的“安全漏洞”并增强系统韧性。
正文:
Python凭什么称霸AI?
先说个扎心的事实:Python能统治AI领域,真不是因为它跑得快。说真的,谁要是告诉你Python性能很好,那他八成没在生产环境跑过真正的模型。在这个AI编程和编程语言对比日益重要的时代,我们需要重新审视这个问题。
Python能赢,是因为它容忍人类犯错。你可以先试个想法,随便把几个库拼在一起,看到结果能跑起来——哪怕你还没完全搞懂原理。这事太重要了。
但问题来了:这种优势建立在一个前提上——代码主要是人写的。现在呢?在AI编程时代,已经不是了。Python是为人类的"含糊"设计的
回想我第一次用Python搞机器学习的时候,我看中的根本不是它有多优雅,而是它有多能忍。数据形状不对?运行时才报错。类型搞错了?运行时才知道。内存爆了?重启Jupyter内核呗。
这不是吐槽,这恰恰是Python在AI研究领域传播这么快的原因——你可以随便折腾,不用想太多后果。Rust正好相反,你不精准,它就不配合,这么多年来一直被认为不适合做探索性的工作。但AI编程工具改变了这个平衡,为我们提供了新的编程语言对比视角。AI可不在乎哪门语言"用起来爽"
自动补全不会被生命周期搞崩溃,大语言模型不会因为编译器报错而抓狂,多写几行代码换来正确性?它们无所谓。人类会烦,这个区别太关键了。
当AI开始帮你写那些无聊的样板代码时,Python最大的优势——低心智负担——就开始缩水,与此同时,Rust最大的弱点变得可以接受了。你不再需要一个人跟借用检查器死磕了,你可以问AI它为什么不高兴,然后从根本上解决问题,而不是贴创可贴。这是完全不同的开发循环。在真实的AI系统里,这已经发生了
别看博客怎么吹,看看生产环境。文本预处理、分词、流式推理、向量索引、那些7×24跑着不能挂的服务……你猜怎么着?越往底层挖,Python的身影就越少。
不是因为Python不好,而是因为不可预测在规模化面前太贵了。Rust给你的是无聊的系统,而无聊的系统活得久。大厂已经在行动了
这不是我瞎说,看看这些数据:Cloudflare
用Rust写了自家的LLM推理引擎 Infire,比主流的vLLM快7%,CPU开销更低,GPU利用率更高Hugging Face
的核心组件——tokenizers(10000+ stars)、safetensors、Candle(17000+ stars)——全是Rust写的Microsoft
内部报告显示,约70%的安全漏洞都是内存安全问题,所以他们在Windows和Azure组件里大力推Rust商业Rust使用量
在2021-2024年间增长了68.75%,2025年还在加速
Rust vs Python:性能差距到底有多大?
说到编程语言对比和性能优化,我们必须看些硬核的数字。根据最新的基准测试,同样的模型:
场景
Rust (Candle)
Python (PyTorch)
提升
BERT推理
-快47%
ResNet-50处理
-快35%
LLaMA 2生成
128.3 tokens/s
82.7 tokens/s快55%
更狠的是,用Rust做AI推理可以比Python快3-4倍,内存占用减半。对于CPU密集型任务,Rust比Python快约60倍——这不是打错字,是六十倍。这种巨大的性能优化潜力,在AI编程领域尤其重要。
为什么差这么多?Python有个臭名昭著的GIL(全局解释器锁),真正的并行执行被锁死了。而Rust编译成原生机器码,没有垃圾回收器拖后腿,零成本抽象不是说说而已。一个小例子,但说明了很多问题
这种代码,团队在流量上来之后都会悄悄从Python里搬出去:
use rayon::prelude::*;use regex::Regex;fn normalize(s: &str) ->String { letre = Regex::new(r"[^\w\s]").unwrap(); re.replace_all(&s.to_lowercase(), "").to_string()}fn run(batch: Vec
) ->Vec { batch.par_iter() .map(|x| normalize(x)) .collect()}
没什么花哨的,默认就是并行、安全、可预测。换成Python,这种需求通常会演变成一场关于GIL的讨论、worker进程的争论,或者干脆"用C重写那部分"——而Rust就是那个"更底层"的东西本身。这个编程语言对比的选择直接影响性能优化的效果。
Hugging Face为什么要用Rust写Candle?官方说法是:让Serverless推理成为可能。PyTorch太重了,在集群上创建实例慢得要死;Rust的Candle可以部署轻量级二进制文件,还能跑在WebAssembly上。这是AI编程基础设施的重要进步。Python没在输,只是戏份变了
我不是来唱衰Python的,那种论调太懒了。Python正在变成想法起步的地方,Rust正在变成想法被迫存活下来的地方。以前这个分工不太重要,现在重要了,因为AI系统可容忍不了笔记本里那种不确定性。
现在流行的做法是:Python做原型,Rust上生产。这种编程语言对比的组合策略,在AI编程领域特别有效。Polars就是这么干的——一个用Rust写的DataFrame库,性能吊打pandas,但保留了Python接口让你无缝切换。这是典型的性能优化案例。为什么这种变化感觉不到?
因为教程还没跟上,因为Python在教育领域还是霸主,因为大多数人看到的是demo,不是生产环境的故障。但真正在跑AI编程服务的团队,更在乎的是半夜别被叫起来,而不是代码写起来有多"表达力"。Rust更符合这种心态,因为它提供了更好的性能优化和可靠性。这种编程语言对比的选择,在规模化时变得尤为重要。说到底是这么回事
Python最大的优势是帮人类想得更快,AI编程改变了这个公式。当机器开始帮你写代码,那些为正确性和保证而优化的语言,就悄悄开始占便宜了。在这个编程语言对比的新时代,性能优化和可靠性变得比开发速度更重要。
Rust不是突然火起来的,是AI编程环境变了,变得适合它了。就像你一直穿着滑雪板在沙滩上走,突然有一天下雪了。Rust的崛起标志着编程语言对比进入了新的阶段,特别是在需要性能优化的AI编程领域。
如果觉得这篇文章有点意思,欢迎点赞、转发、收藏三连走起。关注我,后续会聊更多编程语言演进和AI时代开发者生存指南的话题。有想法可以评论区聊,咱们一起探讨。
想用 AI 帮你写代码、写脚本、搭自动化工具,但又不想闭眼冲几千?我整理了一份 Claude Code & Codex 工具:月卡从 180 元/月起,不同档位每天大概能用多少刀、适合什么使 用强度都写清楚了。
添加微信公众号小助手进行咨询
本文排版使用: rex微信公众号排版工具
http://tool.rexai.top/tools/wechat-markdown
主题分类:
技术攻防与供应链安全
新闻 8: 无标题
来源: 新浪微博视频 - 自媒体
主题: 中美AI算力竞争的战略意义与社会影响
摘要:
卢麒元评论中美算力竞争,认为其战略意义重大,超越其他领域,并强调必须避免出现代际差距,将其比作美苏军备竞赛。但他同时指出,单纯的算力优势无法解决劳动者的就业和收入问题。
分析:
它明确讨论了“中美算力竞争”这一核心AI技术领域的战略竞争,并强调“必须避免出现代际差距”,将其与“美苏军备竞赛”相提并论,这直接涉及国家在AI核心技术(算力)上的“技术攻防与供应链安全”问题。
正文:
//@卢麒元
,我一直忧虑于中美算力竞争的问题。从某种意义上说,此竞争的意义超越了其它领域的竞争。确实,必须避免出现代际差距。中庸之道,拒绝极端选择。两条腿走路很重要,多方向选择更重要。AI竞争不亚于当年美苏军备竞赛,时间固然重要,平衡更重要。不过,我也必须强调,单纯的算力优势救不了美国。道理极其简单,算力不能当饭吃,算力不能立刻增加劳动者的就业和收入。当然,我们也同样要避免钻牛角尖,明年天火同人,或已给出答案。
主题分类:
技术攻防与供应链安全
新闻 9: 策略深度报告:关注“十五五”产业布局的重点方向(附下载)
来源: 微信 - 自媒体
主题: 中国“十五五”规划下的产业布局、科技自立自强与人工智能发展战略
摘要:
该新闻深度分析了中国“十五五”规划对产业布局的重点方向,强调构建现代化产业体系、实现科技自立自强,并详细阐述了科技创新(特别是基础科研与人工智能)和先进制造(智能制造与绿色转型)两大核心方向。报告指出,面对技术封锁与供应链风险,中国将加强自主可控,推动国产替代,并在人工智能、半导体、工业软件等前沿领域进行战略性突破。
分析:
该新闻具有高价值。它直接引用了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》这一国家级战略文件,并明确指出“技术封锁与供应链风险威胁产业链安全”,强调了“自主可控”和“国产替代进程”在“半导体、工业软件、高端材料”等关键领域的重要性。同时,新闻详细阐述了“人工智能”作为引领新一轮科技革命和产业变革的战略性技术,是“十五五”期间重点发展的方向之一,并提及了“数据基础设施”、“算力基础设施”和“行业AI解决方案”等具体AI相关领域。这些内容与高价值标准中的“技术攻防与供应链安全”维度高度契合,涉及国家战略层面的技术自主与产业安全。
正文:
1 “十五五”规划为产业发展指明方向
10月28日,新华社受权发布《中共中央关于制定国民经济和社会发展第十五个五年规 划的建议》(以下简称《建议》)。《建议》指出“十五五”时期是基本实现社会主义现 代化夯实基础、全面发力的关键时期,在基本实现社会主义现代化进程中具有承前启 后的重要地位。 从全文看,与“十四五”规划相比,此次《建议》内容更加强调经济发展的质量,进 一步明确构建现代化产业体系、实现科技自立自强,扩大内需尤其提振消费、扩大高 水平对外开放等内容,同时在民生保障、国家安全等方面目标更为清晰。此次《建议》 将“建设现代化产业体系”作为牵引高质量发展的首要任务。与“十四五”规划相 比,《建议》中现代化产业体系的内涵更为丰富,表明党中央对做大做强我国产业链、 提升供给体系竞争力的认识进一步深化。 《建议》将深刻影响我国产业布局和结构调整的方向。“十五五”时期是我国基本实 现社会主义现代化夯实基础、全面发力的关键时期。《建议》研判,这一时期“战略 机遇和风险挑战并存、不确定难预料因素增多”。在此背景下,产业布局的规划显得 尤为重要。
1.1 产业布局的有利条件
体制优势为产业体系构建奠定坚实基础。我国具备社会主义市场经济的体制优势。一 方面,可以充分利用市场机制发展壮大新兴产业及孵化培育未来产业;另一方面,发 挥国家动员科技力量和资源的制度优势,促使企业、科研单位、大专院校等协同参与, 集中力量突破“卡脖子”的关键核心技术。 庞大市场需求优势为产业发展提供空间。我国是全球最具潜力的超大规模市场。这不 仅可以为前沿技术产品的推广应用提供广阔的市场,有利于本土具有国际竞争力的 优秀企业脱颖而出,也有利于虹吸全球先进要素资源,发展我国创新经济,推动世界 经济不断向前。在超大规模市场中,多样化的应用场景需求有望催生更多未来产业技 术路线,促进多技术路线同台竞技、不断演进。在市场需求优势的拉动下,新兴产业 有望形成“市场需求扩张—收入、利润增加—研发投入增长—技术改进、成本下降— 更多市场需求”的良性循环。 稳定的供给优势为产业发展“保驾护航”。我国拥有健全的工业体系和配套能力。与 此同时,支持科技创新的体制机制也在加快完善,多个综合性国家科学中心的建设加 速推进技术突破,量子信息、生物育种、空天科技等前沿领域的基础研究和原始创新成果不断涌现。为我国在新赛道、新领域形成与世界领先国家同步并跑,进而为新兴 产业发展提供了坚实支持。同时,完备的工业体系可以为前沿技术转化落地提供稳定 的产业链配套,能够将新产品快速大规模产业化并在产业化过程中持续改进工艺、降 低成本、提高性能,增强产品的竞争力。此外,我国正强化基础能力建设,加大对人 工智能基础设施、新一代信息基础设施等的投入,新兴产业的保障体系也将稳步建立。 人才优势为产业发展提供源源不断的支持。我国拥有大量高素质劳动者和规模庞大 的高校毕业生,为产业发展提供了人才支撑。同时,具备创新精神和创新思维的科技 企业家正不断涌现,有利于在国际竞争中赢得战略性新兴产业和未来产业发展的先 机和优势。
1.2 产业布局面临的外部挑战
技术封锁与供应链风险威胁产业链安全:在逆全球化思潮抬头的地缘政治背景下,我 国制造业面临外部技术封锁与供应链断链等不确定性风险。部分关键领域还面临“卡 脖子”问题,面临技术围堵可能会持续升级加码。 面对外部技术封锁等不确定性和安全风险,产业布局将更加强调自主可控,对技术自 主创新能力提出更高要求。预计“十五五”时期我国将加强基础研发与原始创新投入, 建立核心技术稳步前进的长效机制。强化自主创新与产业链协同,引导企业向产业链 供应链的“链主”位置攀升。同时,加大力度扶持本土供应链。如在半导体、工业软 件、高端材料等领域,扶持本土企业,加速国产替代进程。 全球产业链重构,产业体系建设更为关键:当今全球产业链供应链加速重构,各国产 业竞争已不局限于单一产品、技术、领域,更多的是整个产业体系的竞争。在产业体 系构建上,预计未来将更加注重产业链协同,提升产业体系的韧性和附加值,推动融 合化发展。为应对全球产业链重构和地缘政治风险,产业布局将更加注重国内区域协 调和多元化国际合作。
实践上,增强产业链供应链韧性或成为重要抓手。在关系国家安全的重点领域,将更 多由国有企业主导关键核心环节,筑牢产业链、供应链韧性。在产业区位布局方面, 未来或将优化产业区域布局。深入实施区域协调发展战略,推动京津冀、长三角、粤 港澳大湾区等经济圈成为高质量发展的核心支撑区,通过产业转移和园区共建等形 式,促进要素有序合理流动。海外拓展方面,深化“一带一路”等合作。加强与共建 国家战略对接,统筹推进重大标志性工程。 前沿领域科技竞争加剧:如今全球科技创新呈现加速态势,技术迭代周期显著缩短, 主要经济体在人工智能、量子科技、生物制造等前沿领域的竞争日趋激烈。一方面, 需要加强技术攻关与成果转化,另一方面,也需要加强人才梯队的培养能力和资源禀 赋的整合能力。预计“十五五”时期将促进数字技术与实体经济融合。深入推进数字 中国建设,促进实体经济和数字经济深度融合。全面实施“人工智能+”行动,全方 位赋能千行百业。2 “十五五”时期我国产业布局值得关注的方向
“十五五”规划建议更加突出“坚持把发展经济的着力点放在实体经济上”,明确保 持制造业合理比重,构建以先进制造业为骨干的现代化产业体系。《建议》将“建设 现代化产业体系,巩固壮大实体经济根基”摆在战略任务的首位,重要性不言而喻。 与“十四五”规划侧重于产业体系的优化升级相比,“十五五”规划建议更加强调现代化产业体系作为“中国式现代化的物质技术基础”。预计未来我国产业发展思路上, 一方面将提高产业体系整体韧性,强调产业协同与融合发展;另一方面,产业布局将 推进关键领域取得战略性突破,并促进其规模化发展。 我们梳理新一轮五年规划中提示的产业变革机遇与结构性方向,包括:(1)科技创新 方向;(2)先进制造方向;(3)扩大内需方向。为把握“十五五”时期我国产业升级 脉络、洞察全球产业发展竞争格局提供参考。重点关注各产业的政策导向、技术发展、 市场格局与未来趋势,把握配置机遇。
2.1 科技创新方向:基础科研与人工智能引领的产业升级
科技创新方向与“加快高水平科技自立自强的举措”要求高度契合。政策强调深入实 施创新驱动发展战略,并特别关注人工智能、生物医药、新能源等前沿领域的突破。 值得注意的是,科技创新在政策框架中不仅是独立的产业方向,更是渗透所有产业的 共性赋能要素,这也是我们提出关注科技创新方向的重要思路。 “十五五”规划建议进一步强调发展新兴产业与未来产业。新兴产业是“十四五”以 来我国产业发展的亮点,“十四五”规划着重于发展壮大战略性新兴产业,而“十五 五”规划则明确表述为“培育壮大新兴产业和未来产业”,并特别指出要加快新能源、 新材料、航空航天、低空经济等战略性新兴产业集群发展。新兴产业的规模化发展, 有望催生数个万亿级市场,成为支撑经济高质量发展的“关键引擎”。同时,《建议》 前瞻布局未来产业,明确提出推动量子科技、生物制造、氢能和核聚变能、脑机接口、 具身智能、第六代移动通信等成为新的经济增长点。这些产业蓄势发力,未来10年新 增规模相当于再造一个中国高技术产业。
从产业布局角度看,科技创新方向可重点关注以下细分领域:
(1)基础科研与硬科技领域
基础科研是科技创新的源头,也是当前政策支持的重点。根据《建议》,“十五五”时 期我国将大幅增加基础研究投入,优化支持机制,瞄准世界科技前沿和国家重大战略 需求,布局一批基础学科研究中心,持续增加高质量科技供给,强化关键共性技术, 前沿引领技术、现代工程技术和颠覆性技术创新。预期这些领域的突破将引领产业变 革,值得重点关注。 我国坚定实施创新驱动发展战略,加强基础研究、夯实科技自立自强根基。国家统计 局数据显示,2024年我国R&D经费投入为36,130亿元,同比增长8.3%。研发经费投入 强度达到2.68%,再创新高。横向对比看,当前我国在技术竞争上已逐步从“追赶者” 向“并跑者、领跑者”迈进。从研发专利情况看,据世界银行披露数据,截至2022年, 我国研发支出强度已提升至2.56%,超过欧盟(2.24%)水平,接近全球(2.67%)水 平,较美国仍有约1个百分点的差距。从专利情况看,截至2024年,我国PCT专利申请 量全球占比25.58%,已超过了美、日、韩、德、法等国。
高端芯片与半导体设备:半导体产业是数字经济的关键一环,也是当前全球技术竞争 的焦点。海外技术封锁迫使我国加快提升自身研发能力,同时在政策大力支持下,半 导体产业链的国产化进程加速。展望“十五五”时期,从设计、材料设备到制造工艺 的全链条均有望获得突破。特别值得注意的是,在人工智能芯片、汽车电子等细分领 域,国内企业正通过差异化竞争策略寻找市场空间。 基础软件与工业软件:操作系统、数据库、中间件等基础软件以及CAD/CAE/EDA等工 业软件是制造业数字化转型的关键支撑。《建议》明确要求提升自主可控水平,推动 软件产业高质量发展。随着传统制造业智能化改造的需求释放,工业软件市场或将迎 来快速增长期。
生物育种与农业科技:作为保障粮食安全的重要支撑,生物育种技术在政策支持下正 加速产业化。基因编辑、分子育种等前沿技术的应用,将重塑农业生产方式,提升农 业生产效率。与此同时,农业科技的数字化转型也创造了新的投资机会。 新材料与前沿领域:新材料是高端制造的基础,在航空航天、新能源汽车、半导体等 领域具有广泛应用。其中,高性能复合材料、半导体材料、生物医用材料等细分赛道 景气度较大,预计“十五五”期间,相关技术突破将持续带动下游产业的升级。
(2)人工智能与数字技术创新领域
人工智能是引领新一轮科技革命和产业变革的战略性技术,也是“十五五”期间重点 发展的方向之一。《建议》明确提出“深入实施数字中国建设”,推动数字经济与实体 经济深度融合。“全面实施‘人工智能+’行动,以人工智能引领科研范式变革。”
在人工智能领域,有几个细分赛道值得重点关注: 数据基础设施:由高质量数据集、数据标注与合成平台、数据存储设备等构成,同时 涵盖数据合规管理、权限分级等数据治理相关设施,为AI模型训练提供合规、充足的 数据原料。数据基础设施对于提升数据供给质量,推动人工智能创新发展具有重要支 撑作用。2024年12月国家发改委等部门联合发布《关于促进数据标注产业高质量发展 的实施意见》,首次对数据标注产业进行系统谋划。随着AI模型训练对高质量标注数 据需求的不断提升,数据治理相关设施市场发展空间广阔。 算力基础设施与算电协同:算力是数字经济的核心生产力,我国正加快构建全国一体 化算力体系。值得注意的是,算力设施与能源资源的协同发展正成为新趋势。华为提 出“算电协同”将成为数据中心建设的新模式,“算优化电,电支撑算”的模式下, 通过计算资源与电力资源的统筹调配,实现资源的优化配置和高效利用。这一趋势将 推动绿色算力技术的发展,带来相关投资机会。
行业AI解决方案:人工智能技术与垂直行业的深度融合符合《建议》中对产业融合发 展的规划精神。在金融领域,AI技术广泛应用于风控、投顾、投研等场景;在医疗领 域,AI辅助诊断、药物研发等应用逐步落地;在工业领域,AI质检、工艺优化等应用 提升制造业的智能化水平。“十五五”期间,随着大模型技术更为成熟,AI在各行业 的应用深度和广度有望进一步扩展。
2.2 先进制造方向:智能制造与绿色转型双轮驱动
报告全文可扫描下方图片二维码进入星球社群查阅下载
(报告来源:万联证券。本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
我们组建了研究报告知识星球社群,加入后您可以享受以下服务:
1、星球中分享最新、专业、深度有价值的行业研究报告、投行报告、白皮书、蓝皮书、公司研报等。报告持续更新;
2、会员可以用提问方式单独获取需要的报告,满足个性化需求;
3、星球中海量研究报告PDF高清版,无限制下载;
4、4000+会员使用的研究报告宝库值得您信赖;
扫描下方二维码加入星球
业务咨询、商务合作:136 3162 3664(同微信)
温馨提示
应广大粉丝要求,「报告研究所」成立了报告交流群,欢迎各位公司、企业、投行、投资机构、政府机构、基金、创业者朋友加入!
这里能且不限于:“每日分享多篇研究报告、行业交流、报告交流、信息交流、寻求合作等......”
入群方式:添加助理微信【touzireport666】,发送「个人纸质名片」或「电子名片」审核后即可入群。
主题分类:
技术攻防与供应链安全
新闻 10: 摩根士丹利研究了大半年人形机器人后,彻底崩溃了
来源: 微信 - 自媒体
主题: 摩根士丹利预测AI驱动的全球机器人市场爆发式增长及中国在供应链中的主导地位
摘要:
摩根士丹利最新报告预测,由“具身智能革命”驱动的全球机器人市场将从2025年的1000亿美元飙升至2050年的25万亿美元,届时全球机器人年销量将达14亿台。中国凭借全产业链优势和63%的人形机器人供应链统治力,成为这场变革的核心引领者,尤其在马达、传感器等核心部件上占据主导地位。报告强调,AI技术正从数字世界全面进入物理世界,推动机器人从工厂走向家庭和城市,并预示上游零部件(如AI芯片、稀土、马达)将迎来黄金十年。
分析:
该新闻具有高价值。文章明确指出“中国凭借全产业链优势与 63% 的人形机器人供应链统治力,正成为这场变革的核心引领者”,尤其在“马达、传感器、结构件等机器人 ‘身体’ 核心环节建立起统治级优势”。这种“统治力”和“全产业链优势”直接关联到“技术攻防与供应链安全”维度中的“供应链中断”和“封锁”风险,表明中国在全球机器人产业供应链中的战略地位和潜在影响力。
正文:
点击👇下方小卡片关注我们
【写在开头】最近微信推荐机制调整了,可能有些朋友会收不到我们的推送,大家别忘了给报告研究所加上星标,以免错过更多精彩内容和最新报告
“在这场全球产业重构中,中国展现出无可比拟的综合优势。”
摩根士丹利(大摩)最新发布的《机器人年鉴》显示——AI 正从数字世界全面进入物理世界,一场被称为 “具身智能革命” 的浪潮即将催生 25 万亿美元规模的全球机器人硬件市场。中国凭借全产业链优势与 63% 的人形机器人供应链统治力,正成为这场变革的核心引领者。
大摩全球机器人模型(GROM)给出了震撼性预测:全球机器人硬件销售额将从 2025 年的 1000 亿美元飙升,2030 年突破 5000 亿美元,2040 年跃升至 9 万亿美元,最终在 2050 年冲破 25 万亿美元大关。若计入软件服务与维护收入,市场规模将实现翻倍增长。支撑这一预测的核心逻辑是 AI 技术的跨界升级 —— 从处理 “比特与位元组” 的知识经济,全面扩展至操控 “原子与光子” 的物理经济。
更惊人的是数量级突破:2050 年全球机器人年销量将达 14 亿台,运行总量攀升至 65 亿台,相当于每 10 人中就有 8 台机器人在运行。大摩指出,这一爆发式增长由五大核心因素共同催化:工业、服务、无人机、自动驾驶、人形机器人等全场景覆盖;技术迭代与政策扶持推动成本下降;全球老龄化催生劳动力替代刚性需求;AI 大模型赋予机器人自主决策能力,其中小型无人机与家用机器人近期潜力最突出,人形机器人将在 2029-2030 年迎来规模化部署。
大摩明确指出,凭借强大的制造能力、稀土资源及政策持续支持,中国已在工业机器人、无人机、自动驾驶等领域实现规模化量产,预计到 2050 年将占据全球机器人销售的 26%,其中工业机器人与无人机市占率更将位居全球前列。
供应链层面的优势更为显著:中国企业在全球人形机器人供应链中独占 63% 的市场份额,尤其在马达、传感器、结构件等机器人 “身体” 核心环节建立起统治级优势。这一优势背后,是中国形成的 “数据收集 - 模型训练 - 量产优化” 正向循环。中国人形机器人企业已跻身全球人形机器人第一梯队。
机器人的普及将引发上游零部件需求的爆炸式增长。大摩测算,要支撑 2050 年 14 亿台的年销量,全球需消耗 57 亿个摄影机(较 2025 年增长 95 倍)、270 亿个马达(增长 260 倍)、410 亿个轴承(增长 200 倍)、170 万吨稀土磁体(增长 480 倍)以及 26 太瓦时电池容量(增长 1450 倍)。这意味着马达、轴承、稀土、AI 芯片等上游供应商将迎来黄金十年。
值得关注的是,大摩特别将低空机器人系统(LARS)列为近期最佳投资标的。随着 3D 导航技术成熟、全球监管框架逐步完善,低空机器人的商用订单即将进入放量期。同时,机器人 “逃离工厂” 的趋势明显,从结构化的车间转向家庭、城市、太空等非结构化环境,推动边缘算力需求爆发,实时推理芯片、模拟技术、传感器等领域成为核心投资主线。
大摩报告还揭示了机器人产业的核心技术转向:训练重点正从传统 AI “大脑”(通用模型)转向与 “身体”(物理动作控制)相结合。这一转变源于物理世界的复杂性 —— 如抓取物体需精准控制力度、动态环境导航需实时决策,这些技能无法通过互联网文本数据简单习得。当前,特斯拉、英伟达、谷歌等巨头正通过模仿学习、视频学习、强化学习等方式突破技术瓶颈,而中国企业凭借完整产业链优势,在软硬协同创新中持续领跑。
“优秀机器人诞生于量产实践。” 大摩在报告中强调,原型机易造,规模化生产才是真正壁垒。中国不仅在硬件制造上占据优势,更在 AI 赋能、成本控制、场景落地等方面形成闭环,有望定义下一个十年的全球产业规则。
我们组建了研究报告知识星球社群,加入后您可以享受以下服务:
1、星球中分享最新、专业、深度有价值的行业研究报告、投行报告、白皮书、蓝皮书、公司研报等。报告持续更新;
2、会员可以用提问方式单独获取需要的报告,满足个性化需求;
3、星球中海量研究报告PDF高清版,无限制下载;
4、4000+会员使用的研究报告宝库值得您信赖;
扫描下方二维码加入星球
业务咨询、商务合作:136 3162 3664(同微信)
温馨提示
应广大粉丝要求,「报告研究所」成立了报告交流群,欢迎各位公司、企业、投行、投资机构、政府机构、基金、创业者朋友加入!
这里能且不限于:“每日分享多篇研究报告、行业交流、报告交流、信息交流、寻求合作等......”
入群方式:添加助理微信【touzireport666】,发送「个人纸质名片」或「电子名片」审核后即可入群
主题分类:
技术攻防与供应链安全
新闻 11: 刚挂掉中方电话,四国赴东京同谋反华,高市搬救兵,或断供光刻胶!
来源: 今日头条 - 自媒体
主题: 半导体供应链竞争与技术封锁
摘要:
美国联合日本等四国在东京举行会议,以“去风险”为名遏制中国,日本随即发出可能断供半导体关键材料光刻胶的信号。新闻指出,中国已通过多元化供应和自主研发提升了光刻胶国产化率,并掌握稀土出口对日方的反制筹码,认为外部压力将加速中国产业链韧性提升。
分析:
该新闻有价值,因为它讨论了日本可能“断供光刻胶”对“半导体产业”的影响。光刻胶是制造“芯片”的关键材料,其供应安全直接关系到人工智能技术发展所需的硬件基础,符合“技术攻防与供应链安全”中关于“芯片”供应链中断的判断标准。
正文:
中美经贸视频会达成合作共识的余温未散,美国便联合日/本等四/国在东/京磋/商,借“去风险”之名行遏制之实。
日方随即释放光刻胶断供信号,态度暧昧却动作明确。要知道光刻胶是半导体产业的“命脉”,全球70%市场由日企掌控,这波操作究竟是试探还是真要撕破脸?
日方此举本质是依托美方换取安全保障,却忽视了全球供应链的发展趋势。2019年日本对韩实施光刻胶禁运,当时韩企国产化率不足10%,经过三年攻坚已飙升至70%,完美印证封锁倒逼创新的规律。如今中方早已构建应对防线,短期可协调韩欧供应商补充供应,长期自主研发成果显著,2025年国产光刻胶市场份额已达32%,预计2026年部分品类自给率将达四成。更关键的是,中方掌握全球90%以上稀土精炼产能,日本82%的稀土依赖中国进口,这成为中方掌握博/弈/主/动/权的重要筹码。
逆全球化操作终究违背经济规律。外部压力只会加速中方产业链韧性提升,任何技术施压的图谋,最终都将在自/主/创/新的浪潮中落空。
主题分类:
技术攻防与供应链安全
新闻 12: 无标题
来源: 新浪微博视频 - 自媒体
主题: AI模型越狱的易用性与安全风险
摘要:
新闻内容指出AI模型“越狱”操作“易如反掌”,暗示了AI模型在安全防护方面存在的显著漏洞和被绕过的风险。
分析:
它明确提到了AI模型“越狱”这一技术攻防行为,并强调其“易如反掌”,这直接关联到AI模型的安全漏洞和潜在的恶意利用风险,符合“技术攻防与供应链安全”的高价值标准。
正文:
越狱 易如反掌//@不能发芽的种子://@欧美二线品牌
//@逍遥兽
,但还是马给象
主题分类:
技术攻防与供应链安全
新闻 13: 2025年要翻篇了,孩子眼中的世界,和你看到的一样吗?
来源: 今日头条 - 自媒体
主题: 2025年儿童新闻思辨教育与年度热点事件回顾,特别是AI技术民主化对供应链安全的影响。
摘要:
该新闻回顾了2025年博雅新闻思辨课为儿童精选的年度十大新闻事件,涵盖文化现象、国际关系、科技发展、社会议题等多个领域。其中,特别提到了DeepSeek开源大模型如何通过技术民主化,帮助包括受芯片限制的中国团队在内的全球开发者参与AI创新,旨在培养孩子的批判性思维和独立见解。
分析:
它在“DeepSeek连续‘放大招’:AI程序员的狂欢日”这一事件中,明确指出DeepSeek的开源推理大模型“打破AI巨头垄断,推动技术民主化,让全球开发者——包括受芯片限制的中国团队——平等参与创新”。这直接关联到“技术攻防与供应链安全”维度中关于“芯片/算法的‘封锁’、‘断供’、‘制裁’”的应对策略,展示了通过开源技术缓解供应链限制的积极作用。
正文:
#上头条 聊热点#
博雅小学堂
给孩子受益终生的人文底色
2025年,从《哪吒2》的百亿奇迹到AI的技术浪潮,从大国关税博弈到街头流行的文化符号,世界正以更复杂的姿态向孩子们铺陈开来。
这一年,博雅新闻思辨课坚持带孩子穿透表象、识别本质。我们不仅记录了一个个改变时代的瞬间,更收获了一群小小评论家真挚的感受、理性的质疑和独立的见解。
我们根据节目收听量和孩子们互动留言的热度,从200期节目中评选出了
博雅新闻(少年版)2025年度十大新闻
一起来看看博雅新闻的主讲老师和孩子们如何彼此影响,用逻辑与共情,共同读懂2025年这个波澜壮阔的世界。
01
《哪吒2》破100亿!
背后是一个“新系统”的胜利
2025.02.21 国内新闻
《哪吒2》破百亿并非偶然。博雅新闻引导孩子用逻辑反证法穿透电影市场冷清是因“消费降级”的说法:若大家真缺钱,为何《哪吒2》和各地演唱会火爆?揭示本质——市场不缺热情,缺的是好作品。讲述影片以传统文化为根、现代情感为魂,依托138家公司5年打磨的工业化协作体系,实现内容与技术双创新。这堂新闻课借此示范如何区分现象与本质,识别关键变量,培养理性归因能力。
思考题
你认为,票房高的电影一定是好电影吗?为什么?
小小评论家
煎饼狗子:
我觉得不一定,这涉及很多因素:1.时代更迭。一个时代票房超多,证明当时的人喜欢那一类电影。但时间不断奔跑,人们的审美也在改变;2.让一部分人喜欢的电影,不一定满足所有人的口味,但它也可能是好电影。总结来说:不应只因票房高这单独因素就说电影好,还要结合自己偏好评价。
02
《没出息》为什么成了网络名曲?
2025.10 24 国内新闻
《没出息》突然成了网络神曲,博雅新闻从语言韵律(四字押韵、契合传统“按字行腔”)、情感共鸣(“连滚带爬”道出自嘲与焦虑)到传播机制(短视频助推、两岸共创),层层解析流行原因。更揭示出了深层文化默契——两岸共享汉语节奏、成语系统与生活情绪。并借王世坚之父与《沉默的荣耀》案例,讲授“孤证不立”的历史思辨法,引导孩子在碎片信息中保持审慎。一首歌,串联语言、心理、政治与历史的多维观察。
思考题
你们同学之间最近流行什么歌曲?分析一下为什么流行?
小小评论家
欢喜丫丫:
我们班火的歌很多,像做操的歌曲是《少年有志》,非常励志,但很多同学听着不顺耳,把它改编成了哈基米搞笑版,每一句都有哈基米,“哈基米没志向,哈基米没梦想”。我后来发现很多火爆的歌曲都是根据某些素材改编,再加上一些网络流行词汇,或是朗朗上口的句子,就非常容易学,传播速度快,能引起大家的共鸣。
03
日本首相涉台言论激怒中国,
为什么必须强烈反击?
2025.11.21 国内新闻
这堂课超越情绪化反应,带孩子从法律、历史与现实三重维度理解日本涉台言论:解析其“存亡危机事态”的模糊修宪意图,回溯《马关条约》到1972年建交的底线,揭示借台海复活军国主义逻辑的危险。通过中方“迎头痛击”等罕见措辞,读懂外交语言的分量;借政治学经典《菊与刀》隐喻,认识日本貌似“温和”与扩张冲动并存的复杂性,最终点明:在无“世界班主任”的国际社会,捍卫国家核心利益靠的是清醒、立场与实力。
思考题
你认为国家和国家之间的关系,到底是实力说了算,还是道理说了算?两个国家之间如何相处才是对的?面对历史,日本对中国和亚洲的人民,应该有什么样的态度?
小小评论家
轩窗映皓:
我认为实力说了算。实力不止是科技水平,也是资源储备、社会制度。实力强的一方,往往会对弱的一方进行经济限制、军事干预、舆论施压等,弱的一方是难以反制的。实力相近时,道德会成为博弈的武器与工具。两国想处理好关系,一定要有地理环境、资源出口、贸易往来、科技产品等各方面的依赖,使双方都有所顾忌。面对历史,日本应该对亚洲人民道歉并补偿,为曾经犯下的错误反思,德国在战后就这么做的。
04
物理学家杨振宁先生去世
你可能不知道他有多厉害
2025.10.18 科技新闻 加更
以杨振宁获诺奖的“宇称不守恒”突破为引,用“如何向外星人定义左右”巧妙阐释抽象物理概念,并以积木类比守恒定律,让理论可感可知。通过“西桃之谜”与吴健雄极低温实验,展现科学始于质疑、成于严谨验证。不仅致敬大师,更传递科学精神——大胆假设、小心求证,并特别还原了吴健雄等女性科学家被忽视的关键贡献,点燃孩子对世界的好奇与敬畏。
05
拆解百度高管女儿“开盒”事件,
未成年人要警惕什么?
2025.03.28 国内新闻
这节新闻课以“开盒”事件切入,系统解析数字隐私风险:从社工库黑产链条到未成年人法律责任,破除“未成年可免责”误区;通过“复现验证”等案例教孩子辨识信息真伪,并提供打码、不晒快递单等实用防护指南。新闻解读不止于安全教育,更强调伦理底线——真正的网络自由,源于对他人隐私与尊严的敬畏,引导孩子在网上评论他人前思考:是否越界?是否伤害?
思考题
你觉得“眼眸”和她的父亲错在了什么地方?他们应该做些什么?
小小评论家
鸢栖晞络♡梨晞:
眼眸错在 1.随便公开别人的秘密:把孕妇阿姨的姓名住址发到网上,就像偷看别人的日记,特别不礼貌,这是违法的! 2.在网上骂人或编造谣言,就像在班级里传小纸条说坏话,会让别人伤心害怕; 3.以为生气就能乱来:有矛盾也不能伤害人。
眼眸应该: 1.马上停手!删掉所有发出去的个人信息,不能再继续传播了。 2.认真道歉3.乖乖接受惩罚 4.以后绝对不能用网络暴力欺负人。
06
盛大的阅兵,压阵出场的
为什么总是东风导弹?
2025.09.05 国内新闻
这节新闻课以9·3阅兵为窗口,解析“东风压阵”背后的国家战略:从防御到攻防一体,再到陆海空“三位一体”核威慑,展现中国军事质变。强调阅兵不是炫耀武力,是“沉默的底线”,体现“以武止戈”的智慧。结合近30国领导人齐聚的“心脏地带”地缘图景,以及抗战老兵与国际友人后代同台的历史传承,揭示阅兵不仅是武力展示,更是对和平的庄严承诺。
思考题
如果你是阅兵现场的小记者,你最想采访谁?会问他什么问题?为什么?
小小评论家
生椰拿铁❤:
大多数人可能采访名人和高官,但我会采访普通士兵。我们能有安定的生活,不仅是前辈用鲜血杀敌,也是新兵用生命在守护祖国的每一寸土地。他们不顾风吹日晒,脸蛋通红,在边境守国土,在船舰上劈波斩浪,十分不容易。我会问:你喜欢你的职业吗?你认为自己的社会价值是什么?对未来有什么憧憬?
07
特朗普 “关税战”:
疯狂背后的目的与全球影响
2025.04.13 国际新闻
解读“特朗普关税战”,带孩子穿透“加税”表象,理解全球经济的深层逻辑:用“100元商品缴145元关税”说明贸易如何“熔断”,借苹果全球供应链揭示产业互联;剖析特朗普的认知偏差与政治算计,更引导思考——当大国抛弃规则、滥用强权,世界将陷入混乱。博雅新闻不灌输立场,而是培养基于事实与系统思维的国际视野,让孩子懂得:真正的国家利益,在于维护合作与秩序的长远智慧。
思考题
你和你家人对中美关税战有怎样的看法或反应?有没有让你印象特别深刻的观点?这场关税战是否对你家庭、亲戚或周围人的生活产生了直接或间接的影响?
小小评论家
LEO:我和家人讨论过关税战。我爸认为特朗普想发财想疯了,如果事情愈演愈烈,可能引发战争;我妈认为中国就该硬气,示弱会被乘胜追击。朋友们都很讨厌特朗普,连巴菲特都批评他,他还不收手。目前对我生活没大影响,我住内陆,对美进口不依赖。但国家是一个整体,爸妈工作目前很稳定,还没造成太大影响。
08
LABUBU还能火多久?
2025.06.16 商业新闻
以“LABUBU玩偶拍出百万天价”为由头,巧妙开启一场面向孩子的商业启蒙。博雅新闻用三个生活化问题拆解潮流消费的本质:为什么人们愿意为“没用”的东西花钱?——因为人不仅追求实用,更渴望满足感与存在感;为什么LABUBU能火?——靠盲盒机制激发社交互动、艺术家IP构建稀缺性、以及“我有你没有”的圈层认同感;那它还能火多久?——当“人人拥有”取代“小众专属”,潮流就会退潮。由此引导孩子思考——流行不等于价值,稀缺未必等于持久,培养对消费文化的理性认知。
思考题
假设你是家长,面对孩子要买某个潮玩,会做出怎样的判断?哪个类型的会网开一面,哪个类型的坚决堵死?
小小评论家
ANA的大海龟
:我有几点意见:1.评估性价比。一个普普通通的潮玩,卖几百就不买,几十元OK。2.看质量。质量不好就不买。3.考虑心理因素。我们班流行抽盲盒,有人为了抽中1/240概率的至臻款,砸了一千也没抽到,最后剩一堆低级笔,还没正常笔好用。4.考量意义。仅随大流意义不大;真心喜欢就有意义,可以买。
09
DeepSeek连续“放大招”:
AI程序员的狂欢日
2025.02.26 科技新闻
解读DeepSeek“开源周”,用“公开菜谱”比喻开源,阐明其作为首个开源推理大模型的意义:性能强、成本低(仅556万美元)、技术全公开,甚至教人用普通显卡高效训练。它打破AI巨头垄断,推动技术民主化,让全球开发者——包括受芯片限制的中国团队——平等参与创新。这不仅是一次技术突破,更是一场激发共创的“AI启蒙运动”,彰显真正进步在于点亮众人创造力。
思考题
马斯克最近发布了会飞的汽车,你觉得地面行驶和飞行这两种能力该如何兼顾呢?
小小评论家
林深见鹿:
要兼顾地面和飞行确实有挑战。设计上,外形得流畅,建议用可折叠机翼,地上跑收起来,飞时再展开。动力系统很关键,也许搞个混合动力,飞行时切换成垂直起降等强劲模式。控制系统要把方向盘和飞行操控整合,让驾驶员轻松切换。安全更不能马虎,除了气囊,还得有降落伞和稳定系统。总之,要在设计、动力、控制、安全等多方面下大功夫。
10
00后歌手改编《李白》引争议,
年轻人偏爱“发疯文学”?
2025.06.27 国内新闻
00后歌手单依纯改编《李白》引发争议,博雅新闻引导孩子理解当代流行文化表达的复杂性。解析“发疯文学”作为年轻人对抗内卷的情绪出口,也看到流行文化对传统符号的浅层挪用,并呈现了两代人在语言规范与表达自由上的价值分歧。最后借《人民日报》观点强调:面对差异,应理解立场背后的处境与需求,培养开放、共情与思辨力——既敬畏传统,也包容新表达。
思考题
在你的身边有没有一些人很喜欢、但另一些人非常讨厌的文化现象?你自己的态度是什么?
小小评论家
丙丙呀:
就拿《哪吒1》来举例吧。 哪咤生来是魔丸,刚开始我还有点不喜欢他,但看他拯救了陈塘关后,我心生敬意。而我的朋友说哪吒是demon,小时候干尽了坏事,不喜欢他。我们还因此闹了几天的矛盾。后来交流了意见,才醒悟过来,每个人对文艺作品都有不同的见解。观点不一致的时候,要互相交流沟通,倾听对方的想法。
2026《博雅新闻思辨课》正在订阅中
全年最低价即将结束
每周4期
国内|国际|科技|商业
新闻素养+社会常识+深度思辨
2026加赠体育新闻
博雅新闻少年版:11岁+
博雅新闻儿童版:6-10岁
主题分类:
技术攻防与供应链安全
新闻 14: 无标题
来源: 新浪微博视频 - 自媒体
主题: 全球AI产业竞争、技术供应链多元化与市场动态
摘要:
“大空头”伯里警告AI泡沫和长期熊市风险。AI巨头竞争加剧,谷歌与Meta合作强化TPU对PyTorch的支持以挑战英伟达,OpenAI计划使用亚马逊AI芯片并筹集百亿美元资金。受此影响,美股科技股普遍下跌,而大宗商品上涨。A股市场金融股异动,新股沐曦大涨。此外,美联储降息预期升温,小米等公司持续发布AI模型并加大研发投入。
分析:
它直接揭示了AI核心技术领域的“技术攻防与供应链安全”动态。具体体现在“AI巨头间的嫌隙正在扩大,报道称谷歌与Meta合作强化TPU对PyTorch的支持,以挑战英伟达”以及“OpenAI正在与亚马逊洽谈,计划从亚马逊筹集至少 100 亿美元资金,并计划在其生产应用中使用亚马逊的 AI 芯片”。这些事实表明主要AI参与者正积极寻求技术替代方案和供应链多元化,以应对潜在的垄断或依赖风险,这对于评估全球AI产业的战略竞争格局和供应链韧性至关重要。
正文:
【“大空头”出击】AI泡泡的证据多起来,股市也越来越接近互联网泡沫时期。“大空头”伯里警告:美国家庭股票财富超越房地产,这是长期熊市先兆。AI巨头间的嫌隙正在扩大,报道称谷歌与Meta合作强化TPU对PyTorch的支持,以挑战英伟达。另有报道称OpenAI正在与亚马逊洽谈,计划从亚马逊筹集至少 100 亿美元资金,并计划在其生产应用中使用亚马逊的 AI 芯片。美国大型科技股集体下跌,特斯拉跌超4%,英伟达跌近4%,谷歌跌超3%,苹果、脸书跌超1%,亚马逊跌0.58%,微软跌0.06%。拖累道指跌0.47%、标普跌1.16%、纳指跌1.81%。大宗表现亮眼,银又新高,金、铜、油、天然气均录得不俗涨幅。大A冰火两重天,上午CPO+有锂人扛旗,下午金融放量拉升,一下子激活市场情绪。只见新人沐曦涨692.95%,市值超过3000亿,不见旧人摩尔哭。盘中异动不一般,多只宽基ETF下午1:30左右放量异动,沪深300(510300)ETF半小时成交超9亿元,800ETF(515800)、沪深300ETF易方达(510310)、嘉实沪深300ETF(159919)半小时均成交超1亿元。盘后,中金、东兴、信达换股方案出炉,并且三家周四复牌,东吴预计总资产将达1万亿,排第四。中金的A股换股价格为36.91元/股,东兴的A股换股价格为16.14元/股,信达的A股换股价格为19.15元/股。换股价中金溢价6%,东兴溢价22%,信达溢价8%。东兴与中金的换股比例为1
.4373,信达与中金的换股比例为1
.5188。换股比例计算,中金为本次换股吸收合并发行的A股约30亿股。周四还有2件大事,首先、海南自由贸易港正式启动全岛封关。其次,万科将举行第二次会议,将决定债券展债议案“闯关”能否成功,若出现实质性违约,还可能对市场信心产生重要影响。美联储新掌门的面试工作正在进行中,金发翁现在青睐的沃什和哈塞特都是绝对支持者,主张激进的降息周期,在最短时间内把利率降到1%左右。美联储理事沃勒助攻鸽派言论:“就业市场表明美联储应继续降息,美联储的利率水平比中性利率高出50到100个基点。沃勒不认为通胀会再度加速上行。”首富马斯克已经坚定重回象正营,目标2026年中选,金发翁这下略有开心。金发翁下令对所有进出委内瑞拉的受制裁油轮实施“全面彻底的封锁”。模型竞赛加速,阿里通义万相发布2.6版本,通义在12月2日推出2.5版本。小米发布MiMoV2Flash大模型,并推出在线AI聊天服务。小米宣布未来五年将在研发上投入2000亿元,长期目标是成为全球硬核科技的引领者。具体到今年,预计小米研发投入将达到320元至330亿元,2026年预计投入约400亿元。市场震荡的几个月里,瑞幸9.9也只能隔三差五喝一杯,麦当劳“穷鬼套餐”也舍不得吃。大金融再异动异动,保本就去消费吃肉。$上证指数(SH000001)$
主题分类:
技术攻防与供应链安全
新闻 15: 以下是A股+美股AI受益标的清单
来源: 雪球网 - 自媒体
主题: AI产业链投资标的与风险分析
摘要:
该新闻列出了A股和美股中受益于AI的上市公司清单,涵盖算力基建、芯片/存储、应用与生态三大类,详细说明了各公司与英伟达、微软等科技巨头的业务绑定、核心业务及2025-2026年的催化剂,并提示了全球AI资本开支不及预期、高端芯片出口管制加码及行业竞争加剧等风险。
分析:
它在“风险提示”部分明确提到了“高端芯片出口管制加码”,这直接关联到“技术攻防与供应链安全”维度中的“芯片/算法的封锁、断供、制裁”及“供应链中断”风险,对AI产业的未来发展和投资决策具有重要影响。
正文:
以下是A股+美股AI受益标的清单,聚焦核心业务绑定英伟达/微软/谷歌/亚马逊/华为等巨头,明确2025—2026年催化剂,按算力基建、芯片/存储、应用与生态分类,便于快速筛选。A股标的清单(按产业链)标的代码绑定巨头核心业务2025-2026催化剂中际旭创300308英伟达/微软/谷歌800G/1.6T光模块1.6T量产;谷歌TPU+Meta算力合作订单落地;北美云巨头扩产工业富联601138英伟达AI服务器(全球市占超20%)英伟达H20整机大单交付;AI服务器满产;深圳/天津产线扩能瑞可达688800英伟达224GAEC高速连接器英伟达GB200超算配套放量;与中际旭创合资公司出货超预期沪电股份002463英伟达/阿里AI服务器高多层PCB泰国工厂30%产能专供英伟达;阿里智算中心订单增长生益科技600183英伟达高速覆铜板(M9级认证)高端算力硬件需求爆发;产能1200万㎡/年释放寒武纪688256华为昇腾/国产生态云边端AI芯片(思元系列)思元370量产;端侧AI芯片导入消费电子;国产算力政策落地科大讯飞002230国产生态大模型+行业应用星火V3迭代;教育/医疗AI落地加速;政策补贴落地中科曙光603019海光信息/国产智算高性能服务器+液冷智算中心订单同比+35%;液冷技术渗透率提升;海光芯片放量美股标的清单(按产业链)标的代码绑定巨头核心业务2025-2026催化剂英伟达NVDA微软/谷歌/OpenAIGPU+AI计算生态CES/GTC新品发布;HBM+GB200/H200放量;推理芯片迭代博通AVGO谷歌/微软/英伟达AI定制芯片+高速互联2026年定制AI芯片订单超100亿美元;数据中心带宽升级美光科技MU英伟达/AI服务器厂商HBM/DRAM/NAND存储超级周期延续;HBM价格维持高位;2026财年资本开支提升CredoTechCRDO英伟达/中际旭创224G/512G高速芯片AEC芯片持续渗透;英伟达生态认证扩围;光互连升级微软MSFTOpenAIAzure云+Copilot+OfficeAICopilot付费率提升;AzureAI算力订单增长;OpenAIGPT-5落地UiPathPATH微软/谷歌云RPA+智能体AIAgent商业化加速;大型企业自动化订单放量;利润率提升科磊KLAC台积电/英伟达半导体检测设备AI芯片扩产带动设备需求;先进制程检测升级;2026年资本开支增长核心筛选要点1.算力基建:优先选绑定英伟达/谷歌/微软的光模块、服务器、PCB/覆铜板,催化剂看1.6T量产、订单排期、产线扩能。2.芯片/存储:英伟达/博通/美光为确定性龙头;A股关注寒武纪/海光信息等国产替代,催化剂看量产进度、政策支持。3.应用与生态:美股微软/UiPath商业化成熟;A股科大讯飞等聚焦垂直场景,催化剂看付费率、落地规模。风险提示-全球AI资本开支不及预期;-高端芯片出口管制加码;-行业竞争加剧导致产品降价。
主题分类:
技术攻防与供应链安全
新闻 16: 从宇宙演化维度看中美竞争1:竞合之光
来源: 今日头条 - 自媒体
主题: 中美AI竞争、技术脱钩与供应链安全
摘要:
该新闻从宇宙演化维度探讨中美竞争,将其视为人类文明在跃迁前夕的“双路径压力测试”。文章对比了中国以5G、特高压、光伏治沙为代表的“长城负熵”模式与美国以基因编辑、AI集群、SpaceX为代表的“闪电负熵”模式。文中指出,美国国会的“《2025年AI脱钩法案》”和DeepSeek官网遭受的“恶意攻击”是文明竞争中的摩擦,并强调中美竞争的本质是探索“最优负熵范式”的并行实验,最终目标是应对宇宙热寂,实现星际移民等高难度技术突破。
分析:
它明确提及了“《2025年AI脱钩法案》斩断技术链”,这直接涉及AI技术领域的“封锁”、“断供”和“供应链中断”,符合高价值标准中的“技术攻防与供应链安全”维度。同时,文中还提到了“DeepSeek官网因‘IP源自美国的恶意攻击’而闪烁告警”,也暗示了AI领域潜在的“技术攻防”行为。
正文:
文明的本质,正是人类以智慧为犁,在宇宙的热寂荒漠中开垦秩序绿洲的史诗。
猎户座星云的辉光,是130亿年前恒星葬礼的余烬。那些在超新星熔炉中锻造的碳、氧、铁,跨越时空,最终在地球的海洋里凝结成RNA的初始代码。这颗蓝色行星,是熵增洪流中罕见的负熵孤岛——46亿年间,它将每秒轰击地表的10^38高能粒子与1.5×10^18焦耳太阳能,编织成双螺旋的精密秩序、敦煌壁画的矿物结晶,以及深圳湾畔跳动的5G信号。
若将人类史压缩为一日,23时59分58秒的刻度上,中美两股文明之力正在并联冲刺:波士顿的基因编辑刀锋校准着碱基序列,深圳的AI集群在云端重构认知模型。这不是修昔底德陷阱的重演,而是人类文明在跃迁前夕的
双路径压力测试
——
农耕文明的深层基因
,正以“数字都江堰”的形态复苏:中国以国家战略牵引5G网络织就全球最大信息水网,特高压电网驯服能量洪流,如同李冰父子用鱼嘴分水堤将岷江野性化为沃土滋养。
海洋文明的开拓血脉
,则在硅谷催生“技术雨林”:美国凭借基础算法与芯片架构的先发优势,以风险资本浇灌颠覆性创新,如同哥伦布以六分仪将星辰轨迹转化为新大陆坐标。
当美国国会以《2025年AI脱钩法案》斩断技术链,当DeepSeek官网因“IP源自美国的恶意攻击”而闪烁告警,这恰似文明青春期的小摩擦。宇宙尺度下,真正的威胁并非彼此——而是热寂的终极归宿。从人类命运共同体维度审视星际移民所需十大技术圣杯:
可控核聚变引擎、闭环生态创生系统、量子通信网、AI自治体、核热推进器、原位资源炼金术、人造重力场、基因编辑工程、量子传感阵列、强AI治理
,每一项都需要人类智慧的峰值输出。
而当下中美竞争的本质,是探索“最优负熵范式”的并行实验:
美国的“闪电负熵”
:页岩气革命解锁地壳能量,SpaceX以可回收火箭实现百倍熵减效率,试图以技术奇点突破文明瓶颈。
中国的“长城负熵”
:光伏治沙工程将荒漠转化为能源绿洲,“东数西算”优化能量-信息转换效率,用系统韧性维系秩序稳态
主题分类:
技术攻防与供应链安全
新闻 17: A股最赚钱新股诞生!中一签近40万
来源: 今日头条 - 自媒体
主题: 国产AI GPU企业上市与产业发展
摘要:
国内稀缺的“全栈GPU”设计与量产企业沐曦股份今日登陆科创板,上市首日股价大涨近688%,理论上中一签可盈利近40万元,成为A股全面注册制以来最赚钱新股。该公司主营高性能通用GPU芯片及解决方案,产品广泛应用于AI智算等前沿领域,并已实现智算推理芯片和训推一体芯片的量产应用。尽管目前尚未盈利,但其营收增长迅猛。此次上市标志着中国国产GPU产业进入新发展阶段,并预示着更多国产GPU企业将陆续上市。
分析:
该新闻具有高价值。它详细介绍了沐曦股份这家“国内稀缺的‘全栈GPU’设计与量产企业”的成功上市,其产品“广泛应用于AI智算、数据中心、云计算、自动驾驶等前沿领域”,并已实现“智算推理芯片曦思N100以及训推一体芯片曦云C500”的量产和批量应用。这直接反映了中国在AI芯片领域的自主研发和“供应链安全”能力建设的进展。文章还提及了“更多国产GPU也将迎来上市”,如摩尔线程、燧原科技、壁仞科技和百度昆仑芯,这表明中国正在积极构建国产AI芯片生态,以应对潜在的“封锁”和“断供”风险,对国家在AI领域的“技术攻防与供应链安全”具有重要战略意义。
正文:
今日早盘,A股市场沪指窄幅震荡,创业板指涨超1%。黄白二线分化明显,微盘股指数跌超1%。沪深两市半日成交额1.02万亿,较上个交易日缩量987亿。盘面上热点快速轮动,全市场超3700只个股下跌。
从板块来看,锂矿概念走强,金圆股份4天2板,盛新锂能涨停。中信证券金属分析师刘宇飞认为,2025年储能政策推动储能电池需求超预期增长,单车带电量提升以及以旧换新政策带动动力电池需求提高。预计全球储能及动力电池景气度有望延续,锂盐需求料将继续超预期。
今日登陆上交所科创板,发行价为104.66元/股。上市首日股价大幅高开,盘中最高涨幅超过700%,触及895元,最终收报824.5元,较发行价上涨687.8%,
理论上一签最高或可盈利39.5万元,超越日前上市的摩尔线程,成为A股全面注册制以来最赚钱新股。
沐曦股份成立于2020年9月,总部位于上海,
是国内稀缺的“全栈GPU”设计与量产企业
,主营高性能通用GPU芯片及解决方案,产品广泛应用于AI智算、数据中心、云计算、自动驾驶等前沿领域。
股吧内也沸腾了,有中签的股民感慨,“涨739%时清了。今天太过瘾了,一年都顶不上今天一天。”
随着沐曦股份上市,意味着继中国版英伟达摩尔线程IPO后,中国版AMD也迎来新的发展阶段。
得益于首款智算推理芯片曦思N100以及训推一体芯片曦云C500先后量产和批量应用,该公司业绩近两年迎来大爆发。
2022年-2024 年,沐曦股份分别实现营收43万元、5302万元、7.43 亿元,最近三年营业收入复合增长率高达4075%,比摩尔线程还要迅猛。
不过,沐曦股份同样还尚未盈利。前述期内,沐曦股份净亏损分别为7.77 亿元、8.71 亿元、14.09 亿元,总计亏损超30亿元,低于摩尔线程同期合计超50亿元的亏损。
沐曦股份亏损主要受到前期持续研发投入影响,加之GPU产品从量产到大规模放量需要一定周期,导致收入规模难以覆盖成本费用支出。
今年前三季度,沐曦股份营收达到12.36亿元,远超去年全年,也高于摩尔线程同期7.85亿元的营收;净亏损3.46亿元,则低于摩尔线程7.24亿元的净亏损。
沐曦股份预计,今年全年营收将达15亿元-19.8亿元,同比继续翻倍,净亏损5.27亿元-7.63亿元。摩尔线程预计今年营收12.18亿元-14.98亿元,同比增长178%-242%,净亏损7.30亿元-11.68亿元。
在摩尔线程、沐曦股份上市后,更多国产GPU也将迎来上市,燧原科技也在科创板排队。港股也有望迎来多家公司,壁仞科技赴港上市已获批,百度昆仑芯也考虑在港IPO。
主题分类:
技术攻防与供应链安全