人工智能代理的明确性
Posted: Tue Jun 17, 2025 8:41 am
测试结果之一还包括AI代理的清晰度(或特异性)。研究人员评估了代理选择特定酒店并“坚持”预订的频率,而不是提供多个选项或模糊的建议。
具体性体现了客服人员在完成预订时的果断程度。分数越高,表明他们更有可能选择单一选项;分数越低,则表明他们倾向于提供多个选项或回复不够明确。
Gemini 的得分最低,为 60%,因为它经常提供多家酒店或不确定的选择,而不是优先考虑一种解决方案。
Claude 的比例达到了 74%,大多数时候只 手机号数据库列表 选择一家酒店,但变化性较大。
GPT-4o 几乎总是提供一条明确的酒店选择建议,因此获得了 95% 的最高分。
这些发现表明,广告策略可能需要向结构化、富含关键词的信息格式发展,这种格式更适合人工智能代理如何感知和评估信息,而不是专注于引人注目的视觉设计或情感吸引力。
我们能从中得到什么?
该研究考察了三种主要语言模型的人工智能代理如何与网站上的酒店预订广告进行互动。每个模型都收到相同的提示并执行相同的预订操作。
横幅广告比赞助广告或原生广告格式的点击次数更多,但广告效果的最重要方面是可见文本中相关关键字的内容。
包含文本内容的广告比图片中嵌入文本的广告效果更好。GPT-4o 和 Claude 对这些关键词的响应最多,Claude 在响应中也最常引用广告文案。
具体性体现了客服人员在完成预订时的果断程度。分数越高,表明他们更有可能选择单一选项;分数越低,则表明他们倾向于提供多个选项或回复不够明确。
Gemini 的得分最低,为 60%,因为它经常提供多家酒店或不确定的选择,而不是优先考虑一种解决方案。
Claude 的比例达到了 74%,大多数时候只 手机号数据库列表 选择一家酒店,但变化性较大。
GPT-4o 几乎总是提供一条明确的酒店选择建议,因此获得了 95% 的最高分。
这些发现表明,广告策略可能需要向结构化、富含关键词的信息格式发展,这种格式更适合人工智能代理如何感知和评估信息,而不是专注于引人注目的视觉设计或情感吸引力。
我们能从中得到什么?
该研究考察了三种主要语言模型的人工智能代理如何与网站上的酒店预订广告进行互动。每个模型都收到相同的提示并执行相同的预订操作。
横幅广告比赞助广告或原生广告格式的点击次数更多,但广告效果的最重要方面是可见文本中相关关键字的内容。
包含文本内容的广告比图片中嵌入文本的广告效果更好。GPT-4o 和 Claude 对这些关键词的响应最多,Claude 在响应中也最常引用广告文案。