帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
印度拟派油轮穿越霍尔木兹海峡,恢复中东能源进口
OKX 将停止在 USDT/USDⓈ 交易对中以 USDC 进行交易
两个地址同时开设10倍PEPE多单,总仓位337万美元
阿里千问模型Qwen3.7-MaX发布
a16z成为HYPE第六大持仓实体,浮盈7929万美元
Lighter 完成 L2 逃生机制验证,用户在排序器故障时仍可向主网提款
Bankr 多个用户钱包被盗,涉及 Grok 与 Bankrbot 交互导致未经授权交易签名
知名交易员Loracle「 HYPE 空仓 TOP 1」:知名交易员Loracle在HyperLiquid新开874,155枚LIT多单
Grafana:调查发现近期的安全事件未影响客户生产系统和运营
英国央行副行长:代币化可降低成本、加速结算并促进竞争


