研究显示大模型生成虚假临床信息的可能性高于五成 - 奇客Solidot
原文

2025-08-09 08:52
139
["根据《Communications Medicine》期刊上的一项研究,纽约西奈山医疗中心的研究人员测试了六种大模型在三种条件下的表现,发现这些模型生成虚假临床信息(即幻觉)的概率介于50%至82%之间。","通过采用基于提示词的缓解措施,幻觉率从66%降至44%,其中OpenAI的GPT-4o表现最佳,其幻觉率从53%降至23%。调整温度参数对减少幻觉率效果不明显。"]

全部评论