德勤报告错误引发对加拿大昂贵医疗保健审查中人工智能生成引用的质疑,显示治理缺口。德勤报告错误引发对加拿大昂贵医疗保健审查中人工智能生成引用的质疑,显示治理缺口。

加拿大医疗调查深入,德勤报告错误引发对政策工作中人工智能的新担忧

德勤报告错误

在一项备受关注的加拿大医疗保健审查中发现德勤报告错误后,对公共政策研究的审查力度正在加强。

人工智能相关问题如何在纽芬兰和拉布拉多医疗保健审查中浮现?

根据独立报的调查,由德勤进行的一项加拿大政府委托的医疗保健分析,耗资近160万美元,包含明显的人工智能生成的不准确信息。这份526页的文件于5月由纽芬兰和拉布拉多政府发布,代表了该省卫生部门最近最昂贵的咨询合同之一。

该报告是为当时由自由党领导的卫生和社区服务部准备的。它研究了虚拟护理、留任激励措施以及COVID-19大流行对医疗工作者的影响,这正值纽芬兰和拉布拉多面临严重的护士和医生短缺之际。然而,随后的媒体审查对支撑这些建议的证据的可靠性提出了质疑。

专注于加拿大最东部省份的进步媒体"独立报"发现了多个潜在的不准确之处和异常情况。此外,其调查表明,一些基础研究引用可能是在人工智能工具的协助下产生或扭曲的,尽管主要叙述并非机器撰写。

调查人员发现了哪些类型的加拿大医疗保健报告错误?

根据独立报的说法,德勤报告包含虚假学术引用,引用了编造的学术论文。这些虚构的来源被用来支持成本效益分析,这是塑造医疗保健支出决策的关键组成部分。该报告还错误地将真实研究人员归属于他们从未参与过的研究,在没有证据的地方制造了强有力证据的假象。

一些引用更进一步,描述了据称由研究人员共同撰写的论文,而这些研究人员表示他们从未合作过。话虽如此,审查并未声称每个参考文献都有缺陷。相反,关注点集中在可能削弱对报告关于人员配置、虚拟护理和系统改革结论信心的引用问题模式上。

该报告还引用了一篇据称发表在《加拿大呼吸治疗杂志》上的文章。然而,调查人员无法在该杂志的数据库中找到这篇论文,加深了对生成工具可能发明了听起来合理但实际不存在的来源的担忧。

德勤如何回应人工智能生成引用的指控?

在向财富杂志发表的声明中,德勤加拿大发言人为该工作的实质进行了辩护。"德勤加拿大坚定地支持我们报告中提出的建议,"发言人说。"我们正在修改报告,进行少量引用更正,这些不会影响报告的发现。"

发言人补充说,人工智能并没有产生书面报告本身。相反,他们表示,人工智能"有选择地用于支持少量研究引用"。然而,考虑到医疗保健研究的规模和财务风险,批评者认为,即使是有限地依赖机器生成的参考文献也需要更严格的验证和透明度。

此外,该公司认为引用修正不会影响报告结论的立场引起了审查。一些学者和政策制定者质疑如何在不重新评估任何下游成本效益模型或劳动力预测的情况下纠正伪造或错误归属的研究。

受影响的研究人员对咨询公司事实核查过程有何看法?

新斯科舍省达尔豪斯大学护理学院的兼职教授盖尔·汤布林·墨菲是被错误引用的人之一。她告诉独立报,德勤在一篇"不存在"的学术论文中引用了她。她指出,她只曾与虚假引用中归属的六位其他作者中的三位合作过,而不是描述的全部群体。

"听起来如果你提出这样的事情,他们可能在很大程度上使用人工智能来生成工作,"汤布林·墨菲说。她的评论突显了学术界对生成工具如何能够制造令人信服但不准确的参考书目的日益不安,特别是当顾问没有严格验证每个参考文献时。

她进一步警告说,指导公共政策的报告必须得到经过验证的高质量证据支持。此外,汤布林·墨菲强调,政府和公众为此类工作支付了大量资金,因此它必须"准确、以证据为基础,并有助于推动事情向前发展"。她的批评强调了尽职调查的明显崩溃,而不仅仅是单一的技术错误。

政府委托的报告花费了多少,政治后果是什么?

根据上周三在博客文章中发布的信息访问请求,加拿大政府为德勤研究支付了近160万美元,分八期发放。截至周一,尽管对其参考文献和方法论的争议日益增加,该报告仍在纽芬兰和拉布拉多政府网站上提供。

自报告交付以来,该省的政治领导层已经发生变化。纽芬兰和拉布拉多进步保守党领袖托尼·韦克汉姆于10月底宣誓就任该省新总理。然而,无论是总理办公室还是卫生和社区服务部都没有立即回应财富杂志关于5月报告的问题,他们也没有公开解决这些担忧。

这种沉默留下了关于报告的建议是否将继续指导卫生政策的开放性问题。它还引发了省级立法者或联邦监督机构对咨询公司的研究如何在影响核心公共服务之前进行审查的进一步审查的可能性。

这些德勤报告错误与澳大利亚福利案例相比如何?

加拿大的揭露紧随澳大利亚类似问题之后。7月,德勤制作了一份价值29万美元的报告,帮助澳大利亚政府加强福利合规性。这项237页的研究也依赖于生成技术,后来被发现包含"幻觉",包括对不存在的学术研究的引用和一个伪造的联邦法院判决引述。

在一名研究人员指出问题后,德勤发布了澳大利亚研究的修订版本。上个月悄悄上传到政府网站的更新报告承认,该公司使用了生成语言系统Azure OpenAI来帮助创建初始文档。这一承认仅在外部审查揭露了有缺陷的引用后才出现。

在更新的澳大利亚报告中,德勤写道,"所做的更新绝不会影响或改变报告中的实质内容、发现和建议。"然而,批评者认为,伪造的来源本质上会对任何基于证据的建议的完整性产生怀疑,而不仅仅是表面细节。此外,这第二起事件加剧了对德勤人工智能幻觉和该公司内部事实核查稳健性的辩论。

德勤面临哪些财务后果,加拿大还有哪些未解决的问题?

作为澳大利亚案例的一部分,德勤的当地成员公司被要求为有缺陷的福利报告向联邦政府提供部分退款。这一财务处罚表明官员认为与人工智能相关的不准确性严重到足以保证赔偿。

相比之下,关于与加拿大医疗保健报告相关的任何潜在退款或合同补救措施的信息尚未公开。话虽如此,随着政策制定者、医疗工作者和纳税人询问他们是否为一项现在需要出版后更正其证据基础的研究获得了全部价值,压力可能会增加。

更广泛地说,这两起事件突显了当政府依赖使用生成技术而没有严格保障措施的大型咨询公司时的日益增长的风险。它们还表明,公共机构将需要更强有力的标准来验证来源,特别是在可能影响多年关键服务的长期、复杂的政策报告中。

总之,对德勤加拿大医疗保健审查和澳大利亚福利研究的不断审查强调了当人工智能辅助研究为公共政策决策提供信息时,对可靠证据、透明方法和强有力监督的迫切需求。

市场机遇
null 图标
null实时价格 (null)
--
----
USD
null (null) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。