GPU
英伟达在中国遇到新难题:被阉割版的芯片遭客户冷淡
在2023年10月份美国监管部门禁止英伟达向中国销售高性能AI芯片后,英伟达的工程师们很快就设计出一系列新产品。但问题是,中国云计算公司并不热衷于购买这些性能较弱的特供版芯片。
上海交大新框架大幅提速:4090显卡轻松驱动70B级大模型,LLM推理速度提升11倍
原本需要一张16万元的80G A100干的活,现在只需要一张不到2万元的24G 4090就够了!
上海交大IPADS实验室推出的开源推理框架PowerInfer,让大模型推理速度加快了11倍。而且不用量化,就用FP16精度,也能让40B模型在个人电脑上运行;如果加入量化,甚至2080 Ti也能流畅运行70B模型。摩尔线程发布全新48GB显存加速卡MTT S4000:训推兼顾,专为大模型打造
摩尔线程大模型智算加速卡MTT S4000,采用第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽。基于摩尔线程自研MTLink1.0技术,MTT S4000可以支持多卡互联,助力千亿大模型的分布式计算加速。
AMD携新AI芯片入局,直面英伟达霸权:技术格局的新篇章
在这场助推AI热潮的半导体供应竞赛中,这可能是英伟达迄今面临的最严峻挑战。
AMD的AI市场雄心:挑战与机遇并存的探索之路
AMD(Advanced Micro Devices)多年来一直攻坚克难,取得外界意想不到的成功。现在,它想在AI业务上分一杯羹,这并不容易。
英伟达CEO仍计划在中国销售高端芯片
在美国商务部长警告企业不要试图规避芯片出口限制的数天后,英伟达CEO黄仁勋表示,公司现在的计划是持续与美国政府合作,以便拿出一套符合相关新规定的新产品。
英伟达™(NVIDIA®)GeForce RTX 4090D 中国版将配备 AD102-250 GPU
据称,RTX 4090D 显卡将在不久的将来作为中国独家台式机型号推出,据说将配备 AD102-250 GPU。这种 GPU 变体与最初的 RTX 4090 不同,后者配备的是 AD102-300。
英伟达 RTX 4500 Ada 专业显卡上市:搭载 24GB 显存,17000 元
RTX 4500 Ada的相对性能约等于RTX3090