English

第一章:辨識中的覺察力

在最佳化任何事物之前,我們會選擇要覺察什麼。這第一眼決定了之後的每個模型、指標和政策。覺察不僅僅是「收集資料」,它更是一個承諾,承諾要看見需求,並像人們和地方真有其事般地行動。

快速版

我們想要的結果:

為何要從覺察力開始?

一個簡單的例子

在斑馬線前,駕駛會為孩子減速。沒有人停下來解方程式。一個需求出現了,隨之而來的是義務。這就是覺察力。

現在擴大來看。一個 AI 面對一個充滿「斑馬線」的世界 — 工人、河流、語言、習俗。它可以把這些視為障礙,也可以視為需要關懷的關係。兩者的區別始於這第一眼。

在全球規模下,注意力備受爭奪且容易被操縱。因此,我們保留斑馬線例子的清晰性,並加入在複雜和壓力下仍能成立的簡單規則。

本章背後的簡單理念

基本權利與公正監督

為何這對「對齊」很重要

許多 AI 計畫試圖從舊資料中「學習目標」。但共同目標是變動生活中的協商。當被忽視的人們終於發聲時,目標會隨之轉變。猜測一個完美、固定的目標會失敗。

覺察力提供另一條路:與一個能傾聽、解釋、適應且可以被修正的可信任流程對齊。實務上這意味著:

經驗法則:如果一個決策受到質疑,其模糊的部分必須被釐清。每個人都應該能看到它是如何變得更清晰的。

三個簡單規則

良好的覺察力是什麼樣子

從理念到日常實踐

循序漸進

可行的簡單工具(今天就能建立)

洪水聊天機器人的故事(一個持續的例子)

一個中型城市遭遇洪水。城市啟動一個簡單的聊天機器人來幫助人們申請緊急現金。覺察力在此處的表現如下:

可能出錯的地方(以及快速解決方案)

基本威脅模型

我們如何保持誠信(我們衡量的事物)

你現在可以採用的工具

參與的感受

與其他關懷的介面

淺顯詞語彙編

一個結尾意象:能說「不」的好客門檻

想像有位主人,他能叫出每位客人的名字,替他們安放行李,還會示意他們的到來如何影響了座位安排。這就是「覺察力」。因為有些客人會試圖排擠或抹去別人,主人訂下了一條明確規則:這個家裡的待客之道,必須建立在尊重權利的基礎上。如果我們教 AI 系統,在追求最佳化之前先學會當一個好主人,我們就能保留更多珍貴的東西,並創造更多能分享的好事物。

首頁 下一章