2021/10/02

[閱讀筆記] The Most Human Human - 第二章 認證

 第二章  認證 (Authenticating)


  1. 了解一個人 (having a sense of a person) 跟知道這個人 (knowing about him) 並不一樣

「了解」一個人

(having a sense of a person)

「知道」這個人

(knowing about him) 

著重於「形式」

著重於「內容」

知道一個人的脾氣、行格及相處之道

知道他們在哪成長、幾個兄弟姊妹、大學主修什麼、在哪工作


  1. 某種程度來說,圖靈測試 (Reverse Turing test) 也算某種快速約會 (speed dating) 💑 ,你有五分鐘讓別人知道你是怎麼樣的人,表現的具體、真實、獨特、栩栩如生、與眾不同、有血有肉。如何做自己?表現出自己的樣子,而不是描述自己?這對對話雙方都不是件容易的事情。

  2. 齊夫定律 (Zipf's law),是語言的統計學,是由哈佛大學的語言學家喬治·金斯利·齊夫(George Kingsley Zipf)於1949年發表的實驗定律。在自然語言的語料庫裡,一個單詞出現的頻率與它在頻率表里的排名成反比。所以,頻率最高的單詞出現的頻率大約是出現頻率第二位的單詞的2倍,而出現頻率第二位的單詞則是出現頻率第四位的單詞的2倍。。(https://reurl.cc/XWRxdj)

例子 - Brown 語料庫 (Brown Corpus)

在布朗語料庫中,「the」、「of」、「and」是出現頻率最前的三個單詞,其出現的頻數分別為69971次、36411次、28852次,大約佔整個語料庫100萬個單詞中的7%、3.6%、2.9%,其比例約為6:3:2。大約佔整個語料庫的7%(100萬單詞中出現69971次)。滿足齊夫定律中的描述。僅僅前135個字彙就佔了Brown語料庫的一半。

遵循該定律的現象

單詞的出現頻率、網頁訪問頻率、城市人口、收入前3%的人的收入、地震震級。


  1. Cleverbot 的做法是大量地拾人牙慧,不斷地記錄真人的回應。何以 Cleverbot 可以對基本事實 (ex. 法國首都) 及流行文化 (ex. 八卦、笑話、歌詞) 都聊若指掌,這是因為這些問題都有標準答案,只要資料庫夠大,就不怕真人來踢館。但是若是你問 Cleverbot 住哪裡?多問幾次,它可能每次答案都不一樣,這時就露出馬腳

  2. 尼采認為,「做自己」最重要的一點,就是做獨一無二的自己,不論是好是壞。人就像藝術品一樣,價值高低在於雅致 (concinnity) 與否:「在作品完成時,一切昭然若揭;各部分無分大小,都是由那一丁點的獨特品味所主導與形塑。」

  3. 聊天機器人不會在意自身身分的一貫性,也不會在意對方的身分,內容也常會前後矛盾;大多數聊天機器人的閒聊都是沒頭沒腦 (stateless),每次回答只根據最新提問,就算完全不曉得之前的對談脈絡 (context) 都能回答。

  4. 把人與人的互動燴成一鍋,並無法建立人際關係。例如,50 次 ONS 無法建立關係、50 次快速約會無法建立關係。大樹不是一天長大的,把一車樹苗捆起來或許很壯觀,但終究不是大樹,片段的人性不是人性。

  5. 對友誼、愛情和親密關係感興趣的哲學家,把喜歡的對象分成兩種

喜歡的類型

喜歡特定的、有生命連結的人

或者說是我們喜歡的特質

擁有共同經歷、默契、經驗的人

是容易被取代的,滿街都是的

人數不多、難以取代


  1. 人類吵架就是沒頭沒尾、毫無邏輯、無脈絡可循。如果人與機器人間的對話只是謾罵,就是做球給機器人;相反地,如果問的是需要深入說明的 (ex. 這代表什麼意義呢?為什麼會這樣呢?),多數機器人就難以招架。因為聊天機器人需要預先寫好的劇本,而細心解釋的回答並不在劇本中。要回應這類問題,必須理解對話的前後脈絡 (context) 及相關內容,不是抓上句話找答案而已。

No comments:

Post a Comment