status
type
date
slug
summary
tags
category
password
icon
Total Videos
Link
Video Duration
notion image
相信有关注AI方面的朋友都已经知道昨晚OpenAI发布的新模型GPT-4o(omni)了。简单总结一下就是:
  • GPT-4o具有与GPT4相同甚至超越GPT4的多模态的能力,包括视觉,联网(伪),记忆,代码甚至是GPTs,能够处理各种形式的输入,如图片、视频和音频,并能够以相同的形式进行回应。
  • GPT-4o的语言功能在质量和速度方面都有所提升,支持超过50种语言,其处理速度是上一代模型的5倍,语音延迟大幅降低,达到了人类的反应级别。此外,GPT-4o还能够检测人的情绪,因此能使人机交互更加自然。
  • GPT-4o的视觉能力也得到了强化,它可以同时处理和理解图像以及图像中包含的文本内容。这意味着用户可以上传包含文本的截图、照片或文档,GPT-4o可以识别并解析这些图像中的文字信息。
  • OpenAI计划优化GPT-4o,使其能够进行更自然、实时的语音对话,并计划通过实时视频与ChatGPT进行对话。
  • OpenAI还发布了针对开发者的GPT-4o API,价格仅为之前的一半,速率是原来的5倍。这意味着开发者可以使用这个强大的模型来构建自己的应用程序,将会在速度、成本和功能上都有所提升。
  • OpenAI推出ChatGPT的桌面端,目前仅限Mac系统。
  • 该模型面向所有人开放,包括免费用户。

一些细节

下面我们来简单的聊聊有关GPT-4o模型的一些小细节:

早已曝光?

使用prompt:
套取GPT-4o的提示词如下:
可以看到GPT-4o的知识库截至至去年10月,而半个月之前出现在大模型竞技场的神秘模型gpt2-chatbot的知识库是截止到去年的11月。
notion image
因此本次发布的GPT-4o模型基本可以确定是之前出现在大模型竞技场的神秘模型gpt2-chatbot。就算不是,gpt2-chatbot也很可能是内部测试版。

阉割版?

前一段时间相关社区称GPT4降智了,具体表现为OpenAI偷偷将plus用户的GPT4模型中掺入GPT3.5的回答,并且没有发任何声明,而帖子发布的时间点也刚好对应半个月前出现的神秘模型gpt2-chatbot。
notion image
本以为是OpenAI为了降低成本的操作,但在现在看来可能并不完全是这样。今天我使用Model switch脚本对已经拥有GPT-4o权限的账号测试,发现有一个名叫Dynamic的模型,顾名思义就是动态切换模型来进行回答,美其名曰满足要求,实则降本增效,而这个模型实测会占用GPT-4o的rpm次数。结合前文提到的神秘模型,以及GPT4降智事件,基本可以确定半个月前OpenAI就已经在测试GPT-4o这款能够向所有用户免费开放的模型了。
不过在如今大部分厂商仍然把GPT4级别的模型当做摇钱树的情况下,OpenAI敢向所有用户免费开放GPT-4o的精神还是值得称赞的,毕竟确实比GPT3.5强太多了。
notion image

注意事项

  • 免费账号的GPT-4o的rph是16次/3h,plus用户是免费版的5倍。
  • GPT-4o采用了全新的分词器(tiktoken),这也是GPT-4o的价格对半砍的原因之一,现在它倾向于将非英文语言的句子拆分为更长的词组,但代价。。。
notion image
  • GPT-4o具备检索互联网的能力,可以参考互联网搜索结果。然而GPT-4o 并非直接连接互联网或实时检索数据,而是通过事先训练好的模型和知识库来回答问题。其回答是基于对大量文本数据的学习和理解,而不是实时检索互联网。
  • GPT-4o的语音模式采用了全新的端到端的深度神经网络(DNN),而不是以前需要将语音转文字再文字转语音。因此流畅性大幅提升,并且能够理解情感。

强开GPT-4o

既然是免费向所有人开放,那就不得不白嫖了,由于目前是灰度测试,已经收到GPT-4o邀请的人可以现在就去体验,对于没收到的可以试试以下方法:
使用Tampermonkey插件,新建脚本将以下代码放入,刷新网页即可:

总结

GPT-4o的发布标志着人工智能的又一大步前进,它的出现将对人机交互产生深远影响。我期待看到GPT-4o如何帮助我们更好地理解和解决世界上的问题。
上个星期奥特曼在一次采访中表示:虽然全民免费收入(universal basic income)难以实现,但我们可以实现全民免费计算(universal basic compute)。在未来,所有人都可以免费获得 GPT的算力,可以使用、转售或捐赠。
Altman进一步解释道:“这个想法是,随着 AI 变得更加先进,并嵌入到我们生活的方方面面,拥有像 GPT-7 这样的大语言模型单元可能比金钱更有价值,你拥有了部分生产力。”
下面以Sam Altman最新的一篇blog做结尾吧
There are two things from our announcement today I wanted to highlight. 在我们今天的公告中,我想强调两件事。
First, a key part of our mission is to put very capable AI tools in the hands of people for free (or at a great price). I am very proud that we’ve made the best model in the world available for free in ChatGPT, without ads or anything like that.  首先,我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。
Our initial conception when we started OpenAI was that we’d create AI and use it to create all sorts of benefits for the world. Instead, it now looks like we’ll create AI and then other people will use it to create all sorts of amazing things that we all benefit from.  当我们创立 OpenAI 时,我们的最初构想是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。
We are a business and will find plenty of things to charge for, and that will help us provide free, outstanding AI service to (hopefully) billions of people.  我们是一家企业,会发现很多东西需要收费,这将有助于我们向(希望如此)数十亿人提供免费、出色的人工智能服务。
Second, the new voice (and video) mode is the best computer interface I’ve ever used. It feels like AI from the movies; and it’s still a bit surprising to me that it’s real. Getting to human-level response times and expressiveness turns out to be a big change. 其次,新的语音(和视频)模式是我用过的最好的计算机界面。感觉就像电影里的人工智能一样;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。
The original ChatGPT showed a hint of what was possible with language interfaces; this new thing feels viscerally different. It is fast, smart, fun, natural, and helpful. 最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。
Talking to a computer has never felt really natural for me; now it does. As we add (optional) personalization, access to your information, the ability to take actions on your behalf, and more, I can really see an exciting future where we are able to use computers to do much more than ever before. 对我来说,与电脑交谈从来都不是很自然的事情。现在确实如此。当我们添加(可选)个性化、访问您的信息、代表您采取行动的能力等等时,我确实可以看到一个令人兴奋的未来,我们能够使用计算机做比以往更多的事情。
Finally, huge thanks to the team that poured so much work into making this happen! 最后,非常感谢团队为实现这一目标付出了巨大的努力!
2.1机器学习任务攻略化学专业英语
Loading...