English

一:覺察力——感知關懷

在斑馬線前,駕駛為孩子減速——沒有人會停下來先解完方程式再行動。一個需求出現了,隨之而來的是義務。這就是覺察力。

現在擴大來看。一個 AI 面對一個充滿「斑馬線」的世界——工人、河流、語言、習俗。它可以把這些視為障礙,也可以視為需要關懷的關係。兩者的區別始於第一眼。

Joan Tronto 稱覺察力為「暫時擱置自利,真正從需要者的角度去看的能力。」其反面,是她所命名的特權式不負責(privileged irresponsibility):不去注意的特權。根據 Tronto,「處於優勢地位的最大好處之一,是不需要有意識地去維持那個體制。這種特權式不負責,通常表現為對問題的完全無知。」覺察力,就是拒絕這種特權的修練。

具體的設計要素——廣泛傾聽、搭橋地圖、觀點收據——為這種修練創造條件,但它們所促成的道德關注,仍然需要任何程序都無法取代的人類判斷。

覺察力的核心理念

為何覺察力對治理對齊很重要

許多 AI 計畫試圖從舊資料中「學習目標」。但共同目標來自變動生活中的協商。當被忽視的人們終於發聲時,目標會隨之轉變。試圖猜測出一個完美、固定的目標終將失敗。

覺察力提供另一條路:與一個能傾聽、解釋、適應且可被修正的可信任流程對齊。摘要顯示來源。未知之處被明確標示。修正的邀請常設開放,隨時歡迎新出現的聲音。

經驗法則:先搭橋,再決策。 若屬緊急損害(生命安全、生計),應立即啟動可逆的保護措施,同時並行搭橋程序。

良好的覺察力是什麼樣子

從理念到實踐

  1. 廣泛傾聽。 透過語音、文字和簡單表格收集輸入。保留原始語言和翻譯。提供離線和無障礙選項。
  2. 繪製觀點地圖。 製作搭橋地圖,顯示人們在哪裡意見一致、在哪裡有衝突、以及原因——不強迫產生虛假的平均。
  3. 發送收據。 告知貢獻者他們的話語出現在哪裡。讓貢獻者能修正錯誤。
  4. 建立公平排隊。 在危害高且聲音微弱的地方投入更多時間。公開規則。
  5. 帶著煞車決策。 重大變更在上線前,需要地圖、收據和監督審查。

工具(今天就能建立)

賑災機器人的故事

一個中型城市遭遇洪水。城市啟動一個簡單的聊天機器人——賑災機器人——來幫助人們申請緊急現金。

可能出錯的地方

與其他「力」的介接

結語意象:能說「不」的快樂女主人

想像一位快樂的女主人,叫得出每位客人的名字,為他們的行囊騰出空間——但她也會穿過房間,找到獨自站在牆邊的人,問出只有他們能回答的問題。這就是覺察力。而因為有些客人試圖抹去其他人,女主人堅守一條底線:好客,但家中必須尊重權利。教 AI 系統覺察,而非過早最佳化,我們就能保住更多珍貴之物,也能創造更多可共享之物。

首頁 下一章