让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资
让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资
作者 | 邓咏仪
编辑 | 苏建勋
36 氪获悉,AI 初创公司「硅基流动」(SiliconFlow)近日完成近亿元天使 + 轮融资。本轮融资由某知名产业方领投,跟投方包括智谱 AI、360 和水木清华校友基金等知名企业及机构,老股东耀途资本继续超额跟进,华兴资本担任独家财务顾问。
对本轮融资,创始人兼 CEO 袁进辉表示:" 非常感谢各位投资方对硅基流动的信任和支持。这次融资将帮助我们进一步加快产品创新,为开发者提供触手可及的 AI 云服务,促进 AI 应用层的繁荣,推动 AGI 技术普惠化。"
硅基流动是一家专注于 AI Infra(AI 基础设施)领域的创业公司,成立于 2023 年 8 月。创始人袁进辉是前 OneFlow(一流科技) 创始人及 CEO,曾任微软亚洲研究院主管研究员,获得微软亚洲研究院院长特别奖。
通俗地理解,硅基流动所在的 AI Infra 层,是上接 AI 应用层、下接算力芯片层的中间层,相当于大模型时代的 " 操作系统 "。如何让大模型训练与推理更高效,充分释放底层硬件的潜力,降低生成式 AI 应用开发的门槛与成本,正是 AI Infra 需要解决的关键问题。
大模型训练包括对模型进行参数调优、数据训练等环节,让模型具备执行相应任务的能力;而推理则是在模型训练好之后,让模型进行预测与决策的过程,为 AI 应用提供智能能力。
其中,深度学习训练框架是 AI Infra 的重要组成部分。这个领域被大公司的开源产品所主导,典型框架有 Facebook 的 PyTorch,谷歌的 TensorFlow,国内有百度的 PaddlePaddle 等。从 2016 年开始,作为世界范围内研发工业级通用深度学习框架的唯一创业团队,袁进辉带领的 OneFlow 团队推出了高性能分布式深度学习框架。
之所以敢挑战以大厂主导的 AI 训练框架生态,是因为袁进辉确信:未来 AI 模型的参数量会越来越大。一旦模型变大,那么原有的深度学习框架不能满足开发者的需求,底层的 AI 框架就需要重构,而这是属于创业公司的机会。
随后,以 GPT 为代表的大模型热潮来临,OneFlow 团队所积累的大模型训练技术和认知得到验证。2023 年,处在大模型风口上的 OneFlow 团队被原美团联创王慧文所创立的大模型公司 " 光年之外 " 并购,随后," 光年之外 " 因故被美团并购,袁进辉带领团队创立新公司 " 硅基流动 "。
再次出发,硅基流动依旧将方向定在 AI Infra 赛道。只是,随着大模型走入大规模应用落地时期,推理效率成为阻碍生成式 AI 应用成功的一大技术挑战。因此,硅基流动的技术方向瞄准了大模型推理领域。
英伟达在 2023 年财报电话会后透露,在过去的四个季度中,英伟达数据中心约 40% 的收入都是推理需求驱动的。而根据 Gartner 的报告,2023 年专用于 AI 工作负载的芯片创造近 534 亿美元的收入;到 2027 年,这一数字将达到 1194 亿美元。这无疑是一个具有巨大商业前景的方向,当然,也是大公司和创业公司的必争之地。
袁进辉对 36 氪表示,他希望能够带领硅基流动,在技术领先的基础上,重点解决上一次创业没有解决好的挑战——走通商业化闭环。
6 月,硅基流动正式推出了新产品 —— 一站式大模型 API 云服务平台 SiliconCloud,汇聚了诸多主流大模型,如阿里旗下的通义大模型 Qwen2、智谱旗下的 GLM-4、幻方量化旗下的 DeepSeek V2 系列开源模型,以及文生图模型 SDXL、SDXL Lightning、PhotoMaker、InstantID 等。
基于硅基流动在 AI Infra 领域的深厚积累,SiliconCloud 平台上的大模型响应速度更快,算力成本更低,大大提升了 AI 应用开发效率,并大幅降低了部署成本。比如,使用 SiliconCloud 调用文生图模型 Stable Diffusion,可以达到 1 秒出图;而调用大模型 DeepSeek V2,响应速度可达 50 Tokens/s。这是因为 SiliconCloud 集成了其图片 / 视频生成推理引擎 OneDiff,可以让文生图模型 SDXL 的最高可达 3 倍性能加速;同时,SiliconCloud 还集成了大语言模型推理引擎 SiliconLLM,在各类语言大模型推理场景中,其最高性能加速可达同类开源产品的 10 倍。
袁进辉对 36 氪表示,目前国内大厂旗下的大模型每天生成 Token 量在千亿级别,而 SiliconCloud 上线公测后,平台的调用量就迅速增长。" 仅仅几周后,每天的 Token 生成量达到了数十亿。" 他说。
近期,硅基流动也利用技术优势提供更低价格的模型服务。6 月 25 日,他们正式宣布 SiliconCloud 平台的 Qwen2 ( 7B ) 、GLM4 ( 9B ) 、Yi1.5 ( 9B ) 等顶尖开源大模型免费使用,开发者真正实现 "Token 自由 "。
当前,硅基流动的产品已在多个行业中广泛应用,并且被业内顶级云厂商、芯片公司和大模型公司相继认证为最高等级合作伙伴。对于以后的市场发展计划,袁进辉表示,公司将会同步拓展海外市场。
标签: