无尘阁日记

无尘阁日记

CHATGPT使用文档(中文版)-ChatGPT的图片输入FAQ
2024-02-24

您的指南:如何有效利用ChatGPT的新图片输入功能及理解其限制


什么是图片输入,以及它们在ChatGPT中如何工作?

ChatGPT现在具备了理解和解释您在对话中添加的图片作为图片输入的能力。


如何在对话中使用图片输入?

基本用法:上传一张照片开始。询问图片中的对象,分析文档或探索视觉内容。在后续对话中添加更多图片,以加深或转移讨论。随时返回并添加新照片。


标注图片:为了突出特定区域,考虑在上传前使用照片编辑标记工具对您的图片进行标注。这引导ChatGPT关注您认为重要的元素。


哪些计划可以使用图片输入?

Plus和ChatGPT Enterprise。


哪些模型可以接受图片输入?

GPT-4。


哪些平台上可用图片输入?

所有平台,包括网页(chat.openai.com)和移动端(iOS / Android)。


我的图片是否用于改进你们的模型?

我们使用内容(包括图片)的方法对每个产品都是相同的。


请参考“您的数据如何用于改进模型性能”以更好地理解ChatGPT上的内容如何被用来改进模型性能以及用户有哪些选择。


对于ChatGPT Enterprise,我们不使用内容来训练我们的模型。


如何在ChatGPT中添加图片输入?

确保模型选择器设置为GPT-4,然后点击提示区域的+图标添加图片输入。


图片输入是否支持视频?

不,它不能处理视频。目前仅支持处理静态图片。


支持哪些文件类型?

PNG(.png)、JPEG(.jpeg和.jpg)和非动画GIF(.gif)。


我可以一次上传多少张图片?

您可以添加到对话中的图片数量取决于多种因素,包括图片的大小和附带的文本量。作为一般指导原则,如果遇到问题,考虑减少图片数量或大小。


每张图片的大小限制是多少?

20MB。


图片功能如何处理模糊不清或不明确的图片?

如果图片模糊不清或不明确,模型将尽力解释它。然而,结果可能不够准确。


使用带图片输入的ChatGPT时,用户应该注意哪些限制?

如果您正在使用ChatGPT的新图片输入功能,重要的是要意识到以下限制:


医学:模型不适合解释专业的医学图像,如CT扫描,不应用于医疗建议。


非英文:模型处理带有非拉丁字母文本的图片(如日语或韩语)的表现不佳。


大文本:放大图片中的文本以提高可读性,但避免裁剪重要细节。


旋转:模型可能误解旋转/上下颠倒的文本或图片。


视觉元素:模型可能难以理解图表或颜色或样式(如实线、虚线或点线)变化的文本。


空间:模型在需要精确空间定位的任务上表现不佳,如识别棋盘位置。


准确性:模型在某些情况下可能生成不正确的描述或标题。


形状:模型难以处理全景和鱼眼图片。


元数据和调整大小:模型不处理原始文件名或元数据,并且在分析前图片会被调整大小,影响其原始尺寸。


计数:可能对图片中的对象给出大致的计数。


发表评论: