风险提示:央行等十部委发布《关于进一步防范和处置虚拟货币交易炒作风险的通知》, 请读者提高风险意识。

OpenAI推出Dalle-3

DALL-E 3 代表着OpenAI在生成与您提供的文本完全一致的图像能力方面的一次飞跃

阿法兔
阿法兔
热度 ...

原文作者:阿法兔

原文来源:阿法兔研究笔记

https://openai.com/dall-e-3

  • DALL-E 3 目前处于研究和试用预览阶段,将于 10 月份向 ChatGPT Plus 和企业客户提供。
  • DALL-E 3 :能够理解微妙的细微差别,并根据包含大量细节的提示词出图
  • 根据OpenAI官网,DALL-E 3 主要是针对 ChatGPT Plus 和企业版用户都将可以使用。

现代文本到图像系统往往会忽略文字或描述,迫使用户学习提示工程。DALL-E 3 代表着OpenAI在生成与您提供的文本完全一致的图像能力方面的一次飞跃(Modern text-to-image systems have a tendency to ignore words or descriptions, forcing users to learn prompt engineering. DALL·E 3 represents a leap forward in our ability to generate images that exactly adhere to the text you provide.)

即使相同的提示词,DALL-E 3 也比 DALL-E 2 有显著改进,如下:提示词“An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”

OpenAI左图是DALL-E 2,右图的DALL-E 3

DALL-E 3DALL-E 3 是在 ChatGPT 的基础上开发的,它可以让用户把 ChatGPT 作为你的头脑风暴伙伴和提示的提炼者。从简单的句子到详细的段落,你都可以向 ChatGPT 提出自己的需求。

ChatGPT 中的 DALL-E 3当你提出一个想法时,ChatGPT 会自动为DALL-E 3生成量身定制的详细提示,让你的想法栩栩如生。如果你喜欢某个图像,但它不太合适,你可以要求 ChatGPT 进行调整,只需几个字即可。

OpenAIDALL-E 3 将于 10 月初向 ChatGPT Plus 和企业客户推出。与 DALL-E 2 一样,用户使用 DALL-E 3 创建的图片归自己所有,无需获得OpenAI的许可即可对其进行转载、销售或商品化。

其它示例

和ChatGPT 的集成:让 ChatGPT 制作一个有趣的漫画,ChatGPT可以为 DALL-E 3 提出了概念,并编写了详细的提示词。

OpenAI

再举个例子,跟 ChatGPT说:"制作有趣的表情包:make a funny meme. should be unlike anything seen before."; it prompted DALL·E with: "A penguin in a desert with a suitcase, looking confused, with a text caption that says 'I think I booked the wrong flight'." Not cherry-picked:

OpenAI

还可以使用 DALL-E 3 制作一些非常漂亮和有趣的可视化效果:

OpenAI

还有海报:

关于【OpenAI推出Dalle-3】的延伸阅读

  • Sam Altman 围绕 OpenAI 打造出一个致富帝国

    OpenAI首席执行官奥特曼同时经营副业,但只有一份工作让他发了财。他投资了多家想抓住人工智能风口的公司,包括网络安全软件公司和清洁能源公司。他最成功的投资是支付处理初创公司Stripe。奥特曼也投资了使用OpenAI技术的初创公司。他曾因投资引发利益冲突而被罢免职务,但重新担任首席执行官后制定了新的利益冲突政策。董事会正在进行改革,包括强化利益冲突政策和独立审计委员会。奥特曼计划通过全面披露和董事会管理来解决利益冲突问题。

  • OpenAI 悄悄招募了 Altman 投资的安全团队,但与超级对齐无关

    OpenAI招募了Indent安全团队,由两位联合创始人领导。Indent提供自动化处理访问权限的服务,解决团队扩大带来的访问审批问题。OpenAI前CEO和弟弟参与了Indent的种子轮融资,两者关系密切。Indent将业务拓展到大模型领域,提出针对性的安全解决方案。OpenAI正在加大前沿模型的投入,下一款新模型“GPT Next”将在2024年发布。公司正在加速追求模型的商业化,但安全文化和流程已不再受重视。OpenAI的超级团队解散,表明公司正在加速追求商业化,但也可能是离职员工失望的原因。

OpenAI

卡通图片:

OpenAI

Sam展示的视频:

OpenAI

原理:

  • 早的DALL·E 是 OpenAI 的多模态预训练模型,通过120亿参数的模型,在2.5亿图像文本对上训练完成
  • DALL-E 是一个两阶段的模型:它的第一个阶段是离散变分自编码器(Discrete Variance Auto-Encoder,dVAE),用于生成图像的token。它的第二个阶段是混合了图像和文本特征的,以Transformer为基础的生成模型

OpenAI

上述原理参考自:知乎DALL·E 原理通俗理解-Mr.RottenPeach的文章

你对DALL·E 3怎么看?可以试用一下:)对比一下和Midjourney

参考资料:

1.知乎:DALL·E 原理通俗理解-Mr.RottenPeach

2.Greg的推特

3.https://openai.com/dall-e-3

4.https://zhuanlan.zhihu.com/p/506778898

免责声明:本文仅代表作者个人观点,不代表链观CHAINLOOK立场,不承担法律责任。文章及观点也不构成投资意见。请用户理性看待市场风险,以及遵守所在国家和地区的相关法律法规。
图文来源:阿法兔,如有侵权请联系删除。转载或引用请注明文章出处!

标签:

分享至
https://www.chainlook.cn/toutiao/1695264614.html

下一篇:

VeChain基金会推出去中心化自托管钱包VeWorld移动端

链观CHAINLOOK消息, 据官方公告,VeChain基金会推出去中心化自托管钱包VeWorld的移动端,并 […]

免责声明:
链观CHAINLOOK作为区块链技术应用与Web3行业研究的智库媒体,旨在为中国区块链专家、学者们提供最新的行业资讯信息与数据样本,用于区块链技术研究与创新。本站所发布的文章仅代表作者的个人观点,不代表链观CHAINLOOK官方立场,本站所发布的区块链行业研究报告与数据分析成果是通过人工智能算法对数据内容进行分析与归纳生成,不代表任何投资暗示与建议,链观CHAINLOOK不承担法律责任。

风险提示:
虚拟货币不具有法定货币等同的法律地位,参与虚拟货币投资交易存在法律风险,链观CHAINLOOK坚决反对各类代币炒作,请读者提高风险意识,理性看待区块链技术应用及市场风险。

© 链观CHAINLOOK All Rights Reserved. 京ICP备18054193号-5