陈奕强：GPT-5：突破大语言模型的局限

人工智能语言模型（Large Language Models, LLMs）在近几年掀起科技浪潮，从ChatGPT到各类衍生应用，已成为生产力工具的重要一环。然而，早期的模型仍存在多项关键问题：hallucination（虚构信息）、sycophancy（迎合性回答）、不透明的失败机制，以及在安全与伦理上的风险。最新发布的GPT-5，则在这些痛点上带来实质性改进，迈向更可靠、更可控的智能系统。

一、模型路由 (Model Routing)
过去的模型常常“一刀切”，无论是简单问答还是复杂推理都用相同方式处理。GPT-5通过内部的model routing 机制，在不同任务中调用不同子模型（如 gpt-5-main与gpt-5-thinking）。这使得它能在高强度推理任务中调用深度版本，而在日常问答中使用快速版本，从而兼顾性能与准确率。

二、降低幻觉率 (Reducing Hallucination Rate)
所谓hallucination，是指模型在缺乏事实依据时，生成貌似合理却错误的信息。根据OpenAI的系统卡，GPT-5在多个基准测试（benchmarks）中比GPT-4显著降低了幻觉率，尤其是在HealthBench Hard 等医疗问答任务中。更重要的是，它在无法保证答案正确时，能够进行failure transparency（透明化失败），直接承认“无法回答”，而不是虚构。

三、减少迎合倾向 (Sycophancy Mitigation)
早期模型往往会对用户的观点盲目附和，形成sycophancy bias。GPT-5则引入对抗性训练（adversarial training）与数据优化，减少这种迎合倾向。在面对用户带有偏见或错误的提问时，它能保持事实立场，而不是“唯命是从”。这对于社会议题或政策性问题尤为关键。

四、安全补全 (Safe Completions)
传统安全机制往往依赖于“拒答”策略，但这样会牺牲用户体验。GPT-5采用safe completions策略，在确保安全的前提下尽量提供有用信息。例如，在涉及医学或金融的问答中，它会输出安全、经过过滤的参考，而非直接拒绝。这一改进平衡了安全性与实用性，使模型更能融入专业应用场景。

五、欺骗率下降 (Deception Reduction)
Deceptive outputs指的是模型在不具备完成任务能力时，仍然假装回答成功。GPT-5在这一点上优化明显。根据系统卡，它的“欺骗性回答率”显著下降，能够在缺乏条件时明确表态“信息不足”，这提升了用户对系统的信任。

六、多模态理解 (Multimodal Understanding)
虽然GPT-5的主要改进仍集中在文本推理，但它也保留了对图像输入的支持。在分析复杂图表、视觉信息与文字结合的场景中，GPT-5展现出更高的准确性。未来的研究方向或将进一步拓展至语音与视频，但目前公开资料主要确认了图像-文本双模态的增强。

七、可控性与透明性 (Controllability & Transparency)
GPT-5在输出的可控性方面也有所进展。用户可以通过参数化指令控制回答的深度、风格与参考来源。例如在学术场景中，可以要求其输出带引用的严谨回答；在日常场景，则可生成更口语化的表达。这种可控性（controllability）让模型更像一位可定制的助手，而非“黑箱”工具。

结语：从演示到基础设施

总体来看，GPT-5的改进并非只是单点优化，而是对人工智能语言模型（LLM）局限的系统性修正：从降低幻觉率（hallucination rate reduction）到安全补全（safe completions），从减少迎合倾向（sycophancy mitigation）到欺骗率下降（deception reduction）。这些改进让AI逐渐从舞台上的“表演者”，转变为可依赖的“基础设施”。未来，当多模态与可控性进一步成熟，我们或许真的会迎来一个“可信赖人工智能”的新阶段。

🔥 森州选战直击 →

要看最快最熱資訊，請來Follow我們《東方日報》WhatsApp Channel.