CHATGPT使用文档（中文版）-ChatGPT的图片输入FAQ

CHATGPT使用文档（中文版）-ChatGPT的图片输入FAQ
2024-02-24

您的指南：如何有效利用ChatGPT的新图片输入功能及理解其限制

什么是图片输入，以及它们在ChatGPT中如何工作？

ChatGPT现在具备了理解和解释您在对话中添加的图片作为图片输入的能力。

如何在对话中使用图片输入？

基本用法：上传一张照片开始。询问图片中的对象，分析文档或探索视觉内容。在后续对话中添加更多图片，以加深或转移讨论。随时返回并添加新照片。

标注图片：为了突出特定区域，考虑在上传前使用照片编辑标记工具对您的图片进行标注。这引导ChatGPT关注您认为重要的元素。

哪些计划可以使用图片输入？

Plus和ChatGPT Enterprise。

哪些模型可以接受图片输入？

GPT-4。

哪些平台上可用图片输入？

所有平台，包括网页（chat.openai.com）和移动端（iOS / Android）。

我的图片是否用于改进你们的模型？

我们使用内容（包括图片）的方法对每个产品都是相同的。

请参考“您的数据如何用于改进模型性能”以更好地理解ChatGPT上的内容如何被用来改进模型性能以及用户有哪些选择。

对于ChatGPT Enterprise，我们不使用内容来训练我们的模型。

如何在ChatGPT中添加图片输入？

确保模型选择器设置为GPT-4，然后点击提示区域的+图标添加图片输入。

图片输入是否支持视频？

不，它不能处理视频。目前仅支持处理静态图片。

支持哪些文件类型？

PNG（.png）、JPEG（.jpeg和.jpg）和非动画GIF（.gif）。

我可以一次上传多少张图片？

您可以添加到对话中的图片数量取决于多种因素，包括图片的大小和附带的文本量。作为一般指导原则，如果遇到问题，考虑减少图片数量或大小。

每张图片的大小限制是多少？

20MB。

图片功能如何处理模糊不清或不明确的图片？

如果图片模糊不清或不明确，模型将尽力解释它。然而，结果可能不够准确。

使用带图片输入的ChatGPT时，用户应该注意哪些限制？

如果您正在使用ChatGPT的新图片输入功能，重要的是要意识到以下限制：

医学：模型不适合解释专业的医学图像，如CT扫描，不应用于医疗建议。

非英文：模型处理带有非拉丁字母文本的图片（如日语或韩语）的表现不佳。

大文本：放大图片中的文本以提高可读性，但避免裁剪重要细节。

旋转：模型可能误解旋转/上下颠倒的文本或图片。

视觉元素：模型可能难以理解图表或颜色或样式（如实线、虚线或点线）变化的文本。

空间：模型在需要精确空间定位的任务上表现不佳，如识别棋盘位置。

准确性：模型在某些情况下可能生成不正确的描述或标题。

形状：模型难以处理全景和鱼眼图片。

元数据和调整大小：模型不处理原始文件名或元数据，并且在分析前图片会被调整大小，影响其原始尺寸。

计数：可能对图片中的对象给出大致的计数。