丁冬科技讯 7月29日晚间消息,今日闭幕的2025世界人工智能大会(展览)上,GMI Cloud 发布自研“ AI 应用构建成本计算器”,宣布通过实时量化不同场景下的算力成本、时间损耗与供应商性价比,可为开发者提供成本规划支持。 典型场景评估显示,使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上,回本周期缩短至行业平均水平的 1/3。 Token作为AI文本处理的基本单位,其消耗成本直接决定商业可行性。据行业数据显示,GPT-4 Turbo处理单次多步骤Agent任务消耗可达200万Token(成本约2美元),而工程化部署周期普遍被低估60%。 据介绍,GMI Cloud “ AI 应用构建成本计算器”可基于Token数量与单价(区分输入 / 输出), 核算AI应用/AI Agent 构建总花费;结合Token吞吐量(输入 / 输出速度),计算处理总请求的耗时。同时,该工具还能实时对比OpenAI、Anthropic等15家供应商的Token单价,自动标记Inference Engine等低成本替代方案。 此外,GMI Cloud Inference Engine 的底层调用GMI Cloud 全栈能力,可直接调用英伟达 H200、B200芯片,从硬件到软件进行了端到端的优化,极致优化单位时间内的Token吞吐量,确保其具备最佳的推理性能以及最低的成本,最大限度地帮助客户提升大规模工作时的负载速度以及带宽。同时,其让企业以及用户进行快速部署,选择好模型后即刻扩展,几分钟之后就可以启动模型,并用这个模型进行 Serving。(文猛) 责任编辑:何俊熹 (责任编辑:郭健东 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com |