这篇文章批评了信息治理中当前的数据理想主义,并提倡将数据作为战略和公共资产的现实主义方法。这篇文章批评了信息治理中当前的数据理想主义,并提倡将数据作为战略和公共资产的现实主义方法。

忘记数据伦理 — 真正的战斗是关于谁拥有基础设施

当代数据治理的讨论已被数据理想主义所妥协,数据理想主义将数据主要视为社会和技术法律的产物。数据理想主义有多种变体,如数据伦理、"信任自由流动"、数据去殖民化、数据女性主义、道德人工智能发展等,这些基本上表明我们数字时代的许多社会、政治和经济后果可以通过透明度、公平性和道德一致性的机制来管理。这是一种结构性盲点。在此,我提出数据现实主义作为必要的纠正,要求从计算公平的理念转向更具体的基础设施所有权、标准化杠杆和管理这种不可替代资产的战略能力的现实。

这需要认识到数据现实主义的以下五个关键原则:

1) 世界存在,数据是我们与之接触的唯一方式。

否认这一点就是放弃认识论项目 - 数据可能不完美、被塑造、被中介 — 但仍然是与世界的接触。一旦我们接受数据作为现实接口的基本角色,数据现实主义要求广泛、经济高效地获取数据成为可能。目标是创建和最大化数据公共资源的效用,同时最小化系统风险。如今,人工智能公司和开发者需要明确他们可以使用哪些数据以及如何使用。一个便利的采购框架将消除持续的诉讼威胁,使开发团队能够专注于其模型的质量和性能,而不必担心法律风险管理。目前的公共数据瓶颈抑制了人工智能领域的竞争。

这种专注于"使事物运作"意味着数据现实主义倡导合法化收集公开可用数据的政策。当前的法律模糊性和伦理学家的羞辱使初创企业陷入困境。当然,必须有明确的技术标准来进行数据抓取(速率限制、遵守robots.txt、强制匿名化、排除敏感和非必要数据等),但通过降低基本数据访问成本并创建数据公共资源,国家可以迫使人工智能公司在更优质的建模、上下文应用和算法创新方面竞争 — 而不是比拼谁是最大最坏的专有数据囤积者。

为此,需要更多公共和私人投资于精心策划的、具有上下文的公共数据集。这些经过审核的数据集可以降低初创企业的初始数据采购成本,并为模型开发创建标准化基准,取代昂贵、临时性和具有法律风险的抓取工作。这里的监管政策必须通过激励自愿贡献匿名化、高质量数据集到开源公共资源,来强制要求自然垄断企业共享数据或提供标准化API以获取必要的公共利益数据。此外,如果数据是我们与世界的接触,过度依赖特定指标可能会扭曲信号,因此数据现实主义还要求全面捕捉现实,纳入定性见解和多元指标。

2) 数据与世界共存。

这意味着数据生产是处于特定环境中并通过环境过滤的 - 数据不是抽象概念,而是来自某处、由某人制作、并受工具、协议和权力塑造的关键资源。数据不仅代表现实,还制定现实 - 特别是随着越来越多的信息系统自动化 - 数据塑造公共话语,影响政策,调节真实的人类和机器行为。数据基础设施的物质性远非短暂,数据由留下显著生态和地缘政治足迹的物理系统存储、流通和维护。由于每次互动都会留下痕迹 - 数据现实主义要求我们承认数据不仅仅是"被收集"的,而是其起源和生产是有基础设施的。当数据理想主义学派专注于关于数据的道德论点时,他们也接受了现任霸权(及其道德优先事项)的基础设施主导地位作为不可改变的前提,寻求改善现行权力系统而非挑战其基础。

因此,一个成功的数据现实主义国家必须培养"永久的政治观点",将全球技术发展轨迹整合到自身战略计算中,优先发展围绕数据的主权技术甚至管理标准,并明确将数字产业地理与国家安全目标联系起来。正如世界有赢家和输家,数字社会有数据强国和数据省份。

3) 世界会渗透进来。

数据现实主义不是对监控、仪表盘、电子表格或技术官僚治理的辩护。它是对现实的辩护,将现实视为人类话语和设计之外的东西 — 能够抵抗、令人惊讶并证伪我们模型的东西。为此,数据现实主义拒绝两种主导趋势:

天真的经验主义 — 认为数据"自己会说话",数字是中立的,测量是无辜的。这种观点未能考虑上下文、偏见或解释。

激进的建构主义 — 认为数据只不过是充满权力的构造,完全由意识形态、叙事和位置性塑造。这种观点抹去了世界,将认识论崩溃为政治,往往是为了政治本身。

现实主义立场拒绝对数据化的盲目信仰和纯相对主义的虚无主义。数据现实主义不否认上下文、意识形态或结构。它坚持认为,即使通过这些,世界仍会渗透进来。温度读数。死亡率。投票计数。这些不仅仅是叙事。它们约束着我们。将数据视为真实是认真对待它们 — 不是作为最终真理,而是作为我们与世界的临时接触。它是询问所有这些显示和意味着什么,而不仅仅是谁制作了它以及为什么。因此,数据必须在没有理想化的情况下进行分析,对数据的硬事实的承诺,即使不方便或丑陋(例如,显示不平等、腐败)是必要的,统计欺骗在文明上是有毒的。数据可以被操纵。但操纵预设了可以被扭曲的基线。伪造投票计数仍然依赖于真实投票计数的概念。审查死亡率仍然意味着有死亡发生。用数据撒谎就是承认真相很重要,因为在某种程度上,数据是一个不可协商的现实,独立于我们的政治信仰和道德愿望而存在和运作。这意味着我们必须对用于训练和测试我们系统(人类或人工)的数据进行最高程度的审查。

4) 数据驱动世界中的能动性。

数据不是目的,而是工业、军事和学术能力的指标。一个国家真正的数据能力不是由其人口的数据足迹大小来衡量,而是由其独立标准化、存储和计算数据的能力来衡量,而不依赖外部供应链或治理框架。这需要军事、学术和工业目标的系统整合 — 科学与工业的结合,将数字技术标准视为必须战略性使用而非被动消费的全球公共产品。与理想主义主张相反,国家安全是驱动国家层面数据治理决策的最终政策引擎,隐私和伦理作为次要且通常可协商的约束。霸权和新兴大国的数据政策根本上植根于确保技术优势。因此,任务不是通过隔离消除依赖,而是在数据系统中获得必要的杠杆来塑造其游戏规则。

理想主义的数据政策在政治上是天真的,因为它们假设在无政府状态系统中存在同意和合作。例如,考虑G7的DFFT叙事,它经常被投射为普遍利益,但主要是一种优雅的"信任自由流动"修辞,使用抽象的法律承诺作为掩盖未被承认的全球政治控制具体现实的面具。因此,一个数据现实主义国家必须将所有政策置于一个简单但严格的测试之下:这项政策是否可衡量地增加主权能力并减少结构性依赖,还是仅仅实现与权力的道德合规?数据现实主义因此要求从司法-警察国家(专注于制定和执行法律)向结构性国家(专注于建设和拥有数字能力和元政策空间)的有意义转变。

5) 用数据导航世界需要务实。

数据现实主义是对实用伦理的承诺,而非理想主义。它避开对角线相对的左/右系统概念。它是有效技术加速的哲学,而非技术悲观主义。实用伦理要求直接和立即面对数据流的伦理必要性 - 使收集、清洗、建模和解释的方法对受结果决策影响的人尽可能透明 - 但除了审计和纠正的权利外,数据管理者不应该为了将世界应该如何的愿望投射到他们的数据管道中而烦恼。数据所有权是真相的所有权,因此承担保护和降低其照管数据风险的责任,如有必要,为系统连续性转移该所有权。这里的治理主要任务因此不是使数据和系统符合伦理,而是面对和掌握计算、所有权和能力的可衡量结构事实。

几乎每个人都知道,世界及其政府秘密由会计师运行。这意味着数据应该经过持续评估以确定贬值或升值。一旦你对数据主观价值因上下文变化和偏见发展而衰减或变化进行量化,它将更好地激励组织资源的适当和及时流动,以更新和负责任地解决其数据管道的状态 - 这对保持数据中的现实主义是必要的。更好的数据治理和生命周期管理的财务激励,减少长期基础设施和技术债务,因此应该明确并立即向会计精英传达。

总结而言,随着人工智能和自动化系统在人类事务中获得越来越多的余地,这份宣言呼吁拥抱数据现实主义,这是一种植根于世界不可否认的存在和数据作为我们与之临时接触的基本角色的哲学。这是一项认识到在地缘政治动荡的世界中,依赖外部、专有或地理受限的数据源可能是一个主要系统脆弱性的使命 - 并主张战略性转向数据弹性、可靠性和主权,以保证我们数字生活的不间断运行连续性,不受外部监管或政治压力的影响。

\ \

市场机遇
RealLink 图标
RealLink实时价格 (REAL)
$0.07428
$0.07428$0.07428
+0.20%
USD
RealLink (REAL) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。