English

把 AI 安全當成民防來對待

2026 年 2 月 17 日

唐鳳

演講於 2026 年印度人工智慧影響力峰會,新德里。

外交時間以年為單位,演算法時間以毫秒為單位。AI 危機外交必須彌合這道落差。

各位當地時間好。我是唐鳳,現任臺灣數位治理大使、首任數位發展部長,同時也是 2025 年正命獎得主。由衷感謝 AI Safety Asia 在印度人工智慧影響力峰會上,促成這場至關重要的對話。

外交領域的思考以年為單位:起草文本、凝聚共識、批准承諾,每一步都需要時間。但在 AI 的世界裡,危機以毫秒為單位展開。今天我想討論的,正是外交時間與演算法時間的根本錯配。

演算法時間中的危機

這些危機不是遙遠的將來,它們正在當下發生:公眾人物的深偽影片、跨境擴散的合成語音詐騙、自動化系統甚至在監管機構來得及反應前,就已經把傷害放大到難以收拾。

我們早已見過演算法時間對市場的衝擊——2010 年美股閃崩,美國股市在幾分鐘內暴跌又快速回升。我們也看過它對社會信任的破壞——歐洲刑警組織警告,有組織犯罪正利用 AI 驅動的身份偽冒技術,大規模實施詐騙,同時跨越司法管轄區逃避追緝。

如今一個轉變徹底改變了遊戲規則:AI 不再只是工具,它已經成為參與者。美國國家標準與技術研究院(NIST)最新指引指出,AI 智慧體系統已能自主規劃、執行會影響真實世界系統的行動,OpenClaw 近期的展示也證實了這一點。一旦事件具備自主能動性,應對就不能再仰賴英雄式的臨場應變,而需要制度化的跨國協作機制。

AI 危機外交的三大基礎支柱

那麼 AI 危機外交應該長什麼樣子?我會分享三大基礎支柱,以及一項區域性倡議。

信任:建立具公信力的白名單

臺灣的 111 政府簡訊是官方訊息專用短碼,等同於公共溝通的藍勾勾,民眾可以當下驗證訊息真偽。每則簡訊都會顯示發送機關名稱,以及收件人手機號碼的後三碼:這既能證明發送方確實知悉收件人身分,也透過網路機制擔保發送方的真實性。當民眾信任這個傳遞管道,釣魚、偽冒詐騙自然失去傳播動力。每個國家都需要自己版本的低門檻、可驗證信任管道,就算在危機期間也能穩定運作。

共識:用 AI 實現大規模傾聽,獎勵彌合分歧,而非激化對立

像 Polis 這類工具,把互動簡化為同意/不同意,拿掉了容易放大情緒的回覆串。它會自動浮出「搭橋型論述」——也就是立場對立的群體仍然覺得合理的想法,並把這些想法放到所有人面前。vTaiwan 機制把這項技術和面對面對話結合,能把高度兩極化的議題,轉化為可落地的政策。Talk to the City 這類工具更進一步擴大了傾聽的規模,同時把可稽核性做為核心設計:每個歸納出的主題都能追溯到參與者的原始發言,全社會都能驗證摘要是否忠實反映意見。在危機外交中,正當性就來自速度與可驗證性。

安全:把 AI 事件視為民防事件處理

深偽內容不會在國界前停下,市場的連鎖反應也不會。目前定義、監測 AI 事件的工作已經展開,但我們仍然缺乏跨國協調的運作層串接機制。

區域性倡議

因此我的倡議是:建立區域 AI 危機聯絡網——也就是演算法時代的技術應變熱線。

我們不需要從零開始。網路安全領域,FIRST 已經建立了全球事件應變團隊網絡,APCERT 也為亞太地區提供了可信賴的聯絡框架。我們只需要把這套能力延伸到 AI 專屬事件:可以是深化現有組織的職權、在現有架構中嵌入 AI 領域專業,或是建立互補的聯絡點,對接我們已經建好的網絡即可。

我們的目標是確保當毫秒級的危機來襲時,跨國合作不需要臨場拼湊,而是隨時就能啟動。這不需要政治立場完全一致,只需要技術層面的信任。

讓亞洲成為安全基礎設施的供應者

最後,這是屬於亞洲的機會窗口:讓亞洲不再只是規則的接受者,更要成為安全規範的貢獻者。

本次峰會,是全球南方第一次主辦同等規模的活動,這要歸功於印度的數位公共基礎設施(DPI)展現出的制度實力,越來越受到國際認可。Aadhaar 身分認證系統和 UPI 統一支付介面,已經成為各國學習的領先典範。亞洲完全可以在數位公共基礎設施之上,堆疊一層 AI 治理架構。

關懷六力

最後我想用這句話做結:地震來的時候,沒有人會先去查組織架構圖。真正重要的是,建築是否符合耐震規範、平時是否演練過應變、鄰居之間知不知道怎麼聯繫彼此。

AI 安全也是一樣的道理。在牛津大學 AI 倫理研究院,我們把這些公民能力稱為「關懷六力」——就是社會在「地震」到來前,需要預先鍛鍊的核心肌群。關鍵問題從來不是誰掌控危機當下的權力,而是協作的基礎設施,是否在危機到來前就已經建好了。

讓我們把 AI 安全當成民防來對待:反應快速、與公民社會緊密合作、具備跨國協作能力。讓我們確保 AI 危機外交的制度節奏,能跟得上具自主能動性 AI 的速度,攜手共創無限未來。

謝謝各位。生生不息……繁榮昌盛!

首頁