人工智能语言模型(Large Language Models, LLMs)在近几年掀起科技浪潮,从ChatGPT到各类衍生应用,已成为生产力工具的重要一环。然而,早期的模型仍存在多项关键问题:hallucination(虚构信息)、sycophancy(迎合性回答)、不透明的失败机制,以及在安全与伦理上的风险。最新发布的GPT-5,则在这些痛点上带来实质性改进,迈向更可靠、更可控的智能系统。

一、模型路由 (Model Routing)
过去的模型常常“一刀切”,无论是简单问答还是复杂推理都用相同方式处理。GPT-5通过内部的model routing 机制,在不同任务中调用不同子模型(如 gpt-5-main与gpt-5-thinking)。这使得它能在高强度推理任务中调用深度版本,而在日常问答中使用快速版本,从而兼顾性能与准确率。

二、降低幻觉率 (Reducing Hallucination Rate)
所谓hallucination,是指模型在缺乏事实依据时,生成貌似合理却错误的信息。根据OpenAI的系统卡,GPT-5在多个基准测试(benchmarks)中比GPT-4显著降低了幻觉率,尤其是在HealthBench Hard 等医疗问答任务中。更重要的是,它在无法保证答案正确时,能够进行failure transparency(透明化失败),直接承认“无法回答”,而不是虚构。

三、减少迎合倾向 (Sycophancy Mitigation)
早期模型往往会对用户的观点盲目附和,形成sycophancy bias。GPT-5则引入对抗性训练(adversarial training)与数据优化,减少这种迎合倾向。在面对用户带有偏见或错误的提问时,它能保持事实立场,而不是“唯命是从”。这对于社会议题或政策性问题尤为关键。

四、安全补全 (Safe Completions)
传统安全机制往往依赖于“拒答”策略,但这样会牺牲用户体验。GPT-5采用safe completions策略,在确保安全的前提下尽量提供有用信息。例如,在涉及医学或金融的问答中,它会输出安全、经过过滤的参考,而非直接拒绝。这一改进平衡了安全性与实用性,使模型更能融入专业应用场景。

五、欺骗率下降 (Deception Reduction)
Deceptive outputs指的是模型在不具备完成任务能力时,仍然假装回答成功。GPT-5在这一点上优化明显。根据系统卡,它的“欺骗性回答率”显著下降,能够在缺乏条件时明确表态“信息不足”,这提升了用户对系统的信任。

六、多模态理解 (Multimodal Understanding)
虽然GPT-5的主要改进仍集中在文本推理,但它也保留了对图像输入的支持。在分析复杂图表、视觉信息与文字结合的场景中,GPT-5展现出更高的准确性。未来的研究方向或将进一步拓展至语音与视频,但目前公开资料主要确认了图像-文本双模态的增强。

七、可控性与透明性 (Controllability & Transparency)
GPT-5在输出的可控性方面也有所进展。用户可以通过参数化指令控制回答的深度、风格与参考来源。例如在学术场景中,可以要求其输出带引用的严谨回答;在日常场景,则可生成更口语化的表达。这种可控性(controllability)让模型更像一位可定制的助手,而非“黑箱”工具。

结语:从演示到基础设施

总体来看,GPT-5的改进并非只是单点优化,而是对人工智能语言模型(LLM)局限的系统性修正:从降低幻觉率(hallucination rate reduction)到安全补全 (safe completions),从减少迎合倾向(sycophancy mitigation)到欺骗率下降(deception reduction)。这些改进让AI逐渐从舞台上的“表演者”,转变为可依赖的“基础设施”。未来,当多模态与可控性进一步成熟,我们或许真的会迎来一个“可信赖人工智能”的新阶段。

要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.

热门新闻

阅读全文
图取自《香港01》

许绍雄出殡众星扶灵 佘诗曼含泪道别“父亲”

阅读全文
野村证券发布报告称,中国政府呼吁国民暂缓赴日本,将导致日本经济最少损失2兆2000亿日圆,国内生产总值被拉低0.36%。(法新社档案照)

中国采反制措施 日本经济恐遭重创

阅读全文
市场研究报告显示,大马人对自身财务前景的信心正在减弱,导致许多人削减非必要支出,并把重心放在日常必需品上。(档案照)

越来越担忧三件事 超四成大马人难应付基本开销

阅读全文

印度裔男子遭洪水冲走 迄今生死未卜继续搜寻

阅读全文

你好!大熊猫 “星辰 晓月”

阅读全文

【LIVE】大熊猫“辰星 晓月” 抵达动物园

阅读全文

郑庭河:年轻人与民间宗教活动

名家

无可否认,近些年来国内一些华社民间宗教活动都可见到不少年轻人的身影,包括神诞、游神、法会,还有与特定节日有关的宗教仪式如...

阅读全文

陈锦松:10万罚款背后:权力对媒体的强硬讯号

名家

《星洲日报》与《阳光日报》被通讯及多媒体委员会各开出10万令吉罚单,基于《星洲》刊登不完整国旗插图而遭对付。此举反映了政...

阅读全文

林卓锋:泡沫循环之“边际效应递减”的印钞机

名家

市场上流传著一个近乎宗教信仰的共识:无论泡沫如何破裂,各国央行总能启动印钞机,压低利率,吹起下一个更大的泡沫,让派对永不...

阅读全文

谢癸铨:去殖民的假象——当历史被挪用于政治议程

名家

近期波德申的改名议题引起广泛关注,但其实以去殖民为理由,要求各个地区改名的舆论在马来社群当中早已出现,波德申并不是唯一一...

阅读全文

孙和声:马华文学小议

名家

马华文学始于何时?不同人有不同的说法。本文所说的马华文学是指以华文书写的文艺作品,不包括以英文或马来文书写的文艺作品。一...

阅读全文

马岩岩:欧洲和俄罗斯到了开战边缘?

名家

最近无论是俄罗斯还是欧洲都出现了新的进展。首先,在2025年9月10日晚,俄罗斯发动了对乌克兰的大规模空袭,发射了415...

阅读全文

黄金祥——特朗普的愤怒:美国的黑暗时刻

名家

美国著名MAGA(让美国再次伟大运动)年轻领袖查理·柯克遭枪击身亡,总统特朗普发文哀悼,并下令全国降半旗4天。柯克并非什...

阅读全文

郭朝河:一封电邮能撼动政坛吗?

名家

一个看似寻常的中学生,独自坐在电脑前,做著不愿被人看见的事。只是过不久,萤幕突然跳出一封电邮:影片已被录下,如果不服从指...

阅读全文

林德宜:柯克遇刺的影响

名家

美国右翼活动家柯克被枪杀这件事,不只在美国国内新闻被霸屏,也在全球新闻中引起震动。外国政府与国际组织过去多集中在特朗普、...

阅读全文

冯振豪:习近平不出席东盟峰会,因为……

名家

我国首相安华在8月31日国庆大典结束后直飞天津,出席上海合作组织大会并发表特别演说,9月2日安华一行人前往北京,与中国国...