文|张向前
源|分布式实验室

OpenAI的新业务模式,卖Model instance,起价26万4千美元一年。

这个Model instance的好处是它完全归属于你,你可以按照自己的要求,对它进行有针对的微调,使它具备你需要的专业能力。可以理解为OpenAI提供通用基础脑,而客户可以把它改成专业脑。

由于基础模型的功能已经足够强大,对它进行改造的成本很低,所以企业无需自己从头训练一个大型LLM,直接在OpenAI的基础上微调就能得到自己的模型。

OpenAI悄悄启动了一套全新开发者平台,允许客户使用专用容量运行OpenAI的新型机器学习模型,包括GPT-3.5。根据用户在Twitter上亮出的早期截屏画面,OpenAI即将发布的这款产品名为Foundry,号称“专为运行更大工作负载的顶级客户而设计”。

文件指出,“Foundry能够支持大规模推理,用户可以完全控制模型配置与性能设定。”我们已经联系OpenAI以确认这条消息是否准确可靠。

如果截屏内容可信,那么在启动之后,Foundry将专门为单一客户提供“静态分配”的计算容量(可能由OpenAI的首选公有云平台Azure提供)。这样,用户就能使用OpenAI内部的模型构建和优化工具/仪表板,对特定实例开展监控。此外,Foundry还会提供一定程度的版本控制,由客户决定是否升级到更新的模型版本,并为OpenAI的新模型提供“更健壮”的微调。

Foundry还将提供服务水平承诺,例如正常运行时间和按期工程支持。这些专用计算单元要按季度或年计算租金,运行单一模型实例需要租用特定数量的计算单元(详见下图)。

可以肯定的是,这类实例不会太便宜。即使是GPT-3.5的轻量化版本,三个月期的运行费用也高达7万8千美元;一年期承诺合约的运行成本为26万4千美元。作为对照,英伟达最新一代超级计算机DGX Station的每单元运行价格为14万9千美元。

敏锐的Twitter和Reddit用户们已经发现,实例定价表中列出的文本生成模型之一具有32K的最大上下文窗口(所谓上下文窗口,是指模型在生成其他文本之前所能考虑的背景信息;上下文窗口越大,则代表模型能够「记住」之前的更多文本内容)。OpenAI的最新文本生成模型GPT-3.5具有4K最大上下文窗口,这暗示着此处的新模型很可能是大家期待已久的GPT-4——或者说3.5到4.0之间的某个过渡版本

从微软获得数十亿美元的投资之后,OpenAI目前正背负着巨大的盈利压力。根据报道,该公司预计将在2023年赚到2亿美元。但截至目前,这家初创企业的研发投入已经砸下10亿美元。

这笔开销大部分来自计算成本。对于前沿AI模型的训练而言,瞬间就会烧掉几百万美元,后续的推理运行也不会便宜太多。根据OpenAI联合创始人兼CEO Sam Altman的介绍,OpenAI如今爆火的聊天机器人ChatGPT在处理每次会话时成本为几美分。考虑到早在去年12月,ChatGPT的用户就已经超过百万,这部分运营成本也绝对不容小觑。

在AI货币化的过程中,OpenAI最近还推出了ChatGPT的“Pro”版——ChatGPT Plus,每月起步价20美元。他们还与微软合作开发了Bing Chat,在争议声中迅速获得主流关注。根据相关消息,OpenAI未来还计划推出移动版ChatGPT应用,并将其AI语言技术引入Word、PowerPoint和Outlook等微软产品。

另外,OpenAI将继续通过微软Azure OpenAI服务(一套以企业为中心的模型服务平台)进行技术交付,并维护与GitHub合作开发的付费代码生成服务Copilot[1]。

后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

[1]https://mp.weixin.qq.com/s/rAxz1qacC2Tuo2Nnigvc_g

OpenAI推出新业务模式:售卖Model instance相关推荐

  1. 安谋科技发布新业务品牌“核芯动力”,先手布局智能计算产业

    安谋科技(中国)有限公司("安谋科技")举行"创芯生,赋未来" 新业务品牌战略发布会,重磅发布"双轮驱动"战略以及新业务品牌"核芯 ...

  2. 5G商用大幕拉开 下一个风口:行业新应用、新业务或新商业模式?

    从3G跟随.4G并跑到5G引领,可以说是中国通信业数十年埋头发展的真实写照.5G,中国无疑是全球通信行业的重要贡献者,包括技术.设备.网络.终端.平台到应用开发等.此前中国的通信运营商已率先制定5G测 ...

  3. 苹果手机变成耳机模式怎么调回来_苹果耳机推出“新功能”:打僵尸!

    昨天晚上,苹果悄么声的在官网上发布了他们的最新产品:AirPods Pro,习惯了在发布会上搞大动静发售新产品的苹果,这次走了一波低调奢华的路线. 当然,苹果的文案还是一如既往的稳(如果你还记得iph ...

  4. AI-Powered Concierge App:如何在2018-2019年推出新的业务方式

    一个为您全天候工作的个人助理 - 听起来很诱人,不是吗? 无论你走到哪里,梦想着这样的帮助都会转变为许多分支机构的商业理念,热情好客即将到来. 您的任何客户都很乐意立即获取所需信息,所以也许是时候为您 ...

  5. 净利下降7成、新业务“扛大旗” 阿里转型更需耐心

    股价低迷.被罚款.国内竞争加剧,过去的2021年,阿里巴巴遇到了一个又一个挑战,直观可见的就是股价的下跌.而昨天发布的2021年第四季度财报,似乎也在印证着外界对于阿里的唱衰. 但需要注意的是,没有一 ...

  6. OpenAI 推出漏洞赏金计划,最高奖励 2 万美元;京东零售开启 5 年来最大组织变革;​Django 4.2|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  7. android新架构模式_Android MVIReact架构模式

    android新架构模式 If you are already aware of basic principles of architecture patterns and MVVM and MVI ...

  8. ChatGPT——OpenAI推出的人工智能聊天机器人

    ChatGPT--OpenAI推出的人工智能聊天机器人 目录 [隐藏] 1 什么是ChatGPT 2 ChatGPT的应用领域[3] 3 ChatGPT的原理 4 ChatGPT的发展历程 5 Cha ...

  9. 高擎信息安全大旗,打造“互联网+”新服务模式

    现代社会,各行各业都逐渐建立起了大数据分析系统,大数据已经悄悄渗入我们生活的方方面面.举一个简单的例子:您每天在电商平台的浏览与购买行为.在各搜索引擎搜索过的内容都会被各行各业拿来进行数据分析,将您希 ...

最新文章

  1. 红帽企业集群和存储管理之DRBD+Heartbeat+NFS实现详解
  2. 卷积核的数量是不是越多越好?-分类0,5
  3. 窗体皮肤ssk 跟背景图片冲突_夫西地酸+阿达帕林~我要好皮肤
  4. POJ - 2826 An Easy Problem?!(计算几何,好题)
  5. NodeJS知识汇总
  6. hbase(三)coprocessor
  7. java的多线程总结
  8. C# LINQ 对象克隆
  9. 中职计算机专业阶段成长目标,计算机专业中职生职业生涯规划书
  10. AD9如何设置原点位置
  11. 彻底卸载McAfee Agent
  12. JavaScript 弹窗
  13. Java语言HttpClient使用代理IP
  14. 熵增定律:为什么熵增理论让好多人一下子顿悟了
  15. 湖北商贸学院计算机二级领取,湖北商贸学院教务管理系统入口http://jw.hbc.edu.cn/...
  16. Web2与Web3开发的不同之处
  17. 华为任正非会见马云_什么让华为任正非怒骂“还过个屁年”!连马云、李彦宏都沉思!...
  18. ’Hive快速入门课程视频【菜鸟窝出品】
  19. 蓝桥杯嵌入式(G4系列):RTC时钟
  20. 【它山之玉】写科研论文的高级方法学-科学网马臻

热门文章

  1. 曼陀罗彩绘疗愈系统--艺术疗愈
  2. 2021-10-03对上海建工的两种分析
  3. 每周一篇 文献阅读—paper2
  4. JSP入门及JSP三种脚本
  5. springboot整合apidoc
  6. 组件封装为mxp文件的方法
  7. 原创 | QAV:基于大语言模型的智能体协作的基本原理及应用前景展望
  8. CA01.GBase 8c GDCA 认证培训课前准备
  9. 常用测量仪器和SCPI协议通信相关的那些事
  10. H5页面唤醒App及App之间跳转