为了加速大模型推理技术的发展,特别是以 KVCache 为中心的缓存池化层的标准化,阿里云与清华大学深度共建Mooncake 项目,结合主流大模型推理框架,抽象池化 KVCache的底层接口,实现高效分布式KVCache。
InfoQ · 2024-11-21 06:49:00
英伟达下一代 Blackwell 芯片在高密度服务器机架中出现严重过热问题,导致设计变更和客户方面的部署延迟。
InfoQ · 2024-11-20 03:29:00
呈现AI产品交互的创新实践,并探讨 AI 声学硬件与 AI 应用交互的未来趋势与潜力。
InfoQ · 2024-11-20 03:25:00
“AI 的推理能力必须从被动推理变为主动推理。”
InfoQ · 2024-11-19 10:00:00
“这将是一份乏味的工作,将树敌众多,而且报酬为零。”
InfoQ · 2024-11-18 02:59:00
企业对数据实时性、流动性和处理效率的要求日益增高,传统的数据架构已无法满足 AI 驱动应用的复杂需求。
InfoQ · 2024-11-15 12:00:00
“你的公司做出了一个糟糕的决定。”
InfoQ · 2024-11-15 07:35:00
如何借助 AI 和大模型,打造竞争力强的产品和品牌?从商业与关系的本源出发,寻找AI+产品的黄金场景。
InfoQ · 2024-11-15 04:47:00
多位来自知名企业和机构的专家,将分别从社交生态、政务服务、汽车行业、母婴领域、电商 B 端等角度带来分享,助力从业者深入了解大模型技术在不同行业的实践应用。
InfoQ · 2024-11-15 02:01:00
在企业实际落地过程中,RAG 技术依旧面临着一系列的挑战。
InfoQ · 2024-11-14 07:50:00
本应是一个常规的安全更新,结果却成了 Windows Server 2025系统更新。
InfoQ · 2024-11-13 08:55:00
AI 深入业务场景, 钉钉面向企业关键场景推出 “精选 AI 助理”。
InfoQ · 2024-11-13 06:59:00