跳到主要內容
四千萬人做的測驗沒有科學根據——他們在找什麼?

四千萬人做的測驗沒有科學根據——他們在找什麼?

人生選擇 · 6 個來源 · 約 10 分鐘 ·
目錄(7 節)

你打開手機。朋友傳了一個連結,說「快去測 SBTI,超準」。

你點進去。題目有點好笑,不像 MBTI 那麼正經。做了三分鐘,結果出來了:一個你沒聽過的四字母代碼,配一段描述。你讀了一遍。

「⋯⋯欸,這好像真的蠻像我的。」

你截圖,發到群組裡。有人說跟你很像,有人說他測出來完全不同。你們討論了十分鐘。然後你繼續滑手機,忘了這件事。

如果你做過 MBTI,上面這個過程你應該很熟。就算你沒聽過 SBTI,MBTI 你一定做過,或至少被問過「你是什麼類型」。如果你更早一點,你用的是星座——翻運勢書、查配對、記住每個朋友的星座。工具換了,你做的事情沒變。

2026 年 4 月,微信指數顯示超過四千萬人搜尋了 SBTI。那是一個 B 站 UP 主做的迷因測驗,「SB」就是你想的那個意思。沒有心理學訓練、沒有科學基礎、創作者自己都說只是娛樂。但四千萬人做完之後的第一反應幾乎一樣:怎麼這麼像我。

為什麼?

同一份結果發給全班,準確度 4.2 分

你的大腦天生不擅長辨別這類描述。這不是猜測,是 1949 年就被證明的事。

心理學家 Bertram Forer 讓學生做完一份人格測驗,然後發給每個人「個別」的人格描述。學生用 0-5 分評估準確度,平均打了 4.2 分,超過四成的人直接給滿分。沒有人發現,所有人拿到的是同一份描述。

Forer 的那段文字是從報攤上的星座書拼湊出來的。裡面的句子長這樣:「你有時候外向、善於社交,有時候內向、謹慎。」「你對自己有些嚴格的要求。」「你雖然有些弱點,但通常能夠克服。」

這些句子的特點是:夠模糊到適用於所有人,又夠具體到讓每個人覺得在說自己。Annie Murphy Paul 在《The Cult of Personality Testing》裡解釋這個機制時用了一個詞:巴納姆效應(Barnum Effect)。P.T. Barnum 是十九世紀的馬戲團團長,他說過:最厲害的把戲是讓所有人都覺得在說自己。

SBTI 的 27 種人格描述全都聲稱「這是全中國最稀有的類型」。27 個類型,每個都是最稀有的。你不需要統計學學位就知道這在數學上不可能成立。但做完測驗的人不會算數學,他們在讀那段像在說自己的描述。

Paul 解釋了現象,但沒有回答一個更深的問題:為什麼你的大腦會上當?Timothy Wilson 在《Strangers to Ourselves》裡往裡追了一層:你的大腦有一套他叫做「感覺良好準則」(feel-good criterion)的過濾系統。它會在你不知道的情況下,選擇性地接受讓你感覺好的資訊,忽略不舒服的。人格測驗的結果通常是正面的、討喜的,而你的大腦天生就偏好接受正面描述。

巴納姆效應不是你太笨。是你的大腦在用一個正常的、對生存有利的機制,去處理一個它不擅長辨別的東西。

MBTI 的發明者不是心理學家——她不讓統計學家看計分方式

如果 SBTI 只是迷因,那 MBTI 呢?全球每年超過兩百萬人付費做 MBTI,財星五百大企業用它做人才管理——但 MBTI 的創造者都不是心理學家。這件事本身就值得停下來想一想。

Merve Emre 在《你是哪一型人?》裡追溯了完整的歷史。Katharine Briggs 和 Isabel Myers,Emre 寫道:「她們是自豪的妻子、母親兼家庭主婦,從未受過正式的心理學或精神醫學訓練。」Katharine 在 1923 年讀了榮格的《心理類型》之後,把自己之前所有的筆記全部燒掉,全面皈依榮格的體系。她對榮格的崇拜到了什麼程度?Emre 找到了 Katharine 寫的情色小說,關於一個病人愛上瑞士心理分析師的故事。她在客廳唱「榮格醫生萬歲」。

Isabel 後來把母親的理論做成問卷。她加了一個榮格原著裡沒有的維度(判斷/感知),在自家廚房的餐桌上讓孩子和他們的高中同學試做第一版。後來她找到費城的人力資源顧問 Edward Hay,開始把這份問卷賣給企業客戶。

當美國教育測驗服務社(ETS)的統計學家試圖正式驗證 MBTI 時,發現它的雙極量表缺乏統計效度。Isabel 的反應是拒絕交出計分方式,理由是怕俄國人拿到後「美國和文明世界會消失」。ETS 的首席統計學家最後的結論是:MBTI 的理論「大部分是虛構的」。

Paul 在她的書中提供了更精確的數據。根據美國國家研究委員會(NRC)1991 年的評估報告:在五週到六年的間隔內重測 MBTI,只有 24% 到 61% 的人維持相同類型。換句話說,39% 到 76% 的人會被分配到完全不同的人格類型。即使是 MBTI 支持者自己做的研究,也發現短期重測只有 47% 的人得到相同結果。超過一半的人會變成「另一種人」。

有個研究者在 NRC 報告裡留了一句很安靜的觀察:一名受測者「在下午是很好的直覺思考者,但在早上不是」。你的人格類型會因為你是上午還是下午做測驗而改變。

所以 MBTI 就是偽科學,別信了?

但 Emre 不同意這麼簡單的結論。

不科學的測驗,創造了科學測不到的東西

同一面鏡子碎成不同的碎片,每片映出不同的光——你看到的「自己」,取決於你拿起哪一片

比起直接否定,有一個更微妙的看法:MBTI 的科學基礎確實脆弱,但它創造的效果是真實的。Emre 追溯完整個歷史後的結論是:「儘管效度與信度都遭到質疑,在二十一世紀重生後的 MBTI 仍以強大的自我技術之姿,持續運作。」

什麼叫「自我技術」?Emre 認為 MBTI 給了人一套共同語言來描述自己。「我是 INFJ」比「我有時候很需要獨處但也喜歡深度對話」簡潔一百倍。這個標籤讓你在五秒鐘之內被一群陌生人「理解」,即使這個理解是表面的。

論壇上有人說得更直白:「聊天開話題用的,不要當真。」另一個人說:「就是個參考跟話題。」

經濟學對此有一個解釋:人類會主動選擇歸屬於某個社會類別,而歸屬這件事本身會帶來真實的效用。這是 Akerlof 和 Kranton 在《Identity Economics》裡的核心論點。「當人做自己認為應該做的事情時,他們是快樂的。」選擇一個 MBTI 標籤,就是選擇一個身份。這個身份告訴你什麼行為「像你」、什麼行為「不像你」。

但這裡撞上了 Wilson 的理論。如果人真的像 Wilson 說的那樣,我們對自己的了解大多是事後編造的,「人們建構的自我與非意識的自我幾乎沒有對應關係」——那 Akerlof 說的「效用」建立在什麼基礎上?

答案可能是這樣的:你不需要真的了解自己,就能從一個標籤裡獲得歸屬感。INTJ 描述的可能不是你真實的無意識人格,但你相信自己是 INTJ 並且據此行動,這件事本身讓你快樂了。快樂是真的。它的基礎是一個好故事,不是真相。

我自己做 MBTI 的經驗完全印證了 Emre 的觀察。前後做了好幾次才做完——不是因為題目難,是因為每個問題都覺得「兩邊都對」,很難認真回答。真正讓我做完的動力不是好奇心,是社交壓力:身邊的人一直問「你是什麼類型」,不知道的人反而尷尬。

結果出來,感覺不是驚喜,是確認:嗯,大概是這樣。真正讓我改觀的是後來它在社交場合的效率。對方一聽你的類型,就跳過了十分鐘的自我介紹。Emre 說 MBTI 是「自我技術」,但用起來更像社交壓縮檔——把一個人打包成四個字母,方便傳輸。

這件事不新。學生時期有人問「你什麼星座」,問的不是星座,是在找一個低成本的方式開始認識你。MBTI 把同一個社交功能換了更現代的包裝。SBTI 又換了一次。

你分享結果的真正原因,跟你以為的不一樣

論壇上有人說:「做完測驗再來對對對我就是這種人的話,其實你早就知道標準答案是什麼了。」

這句話比大多數心理學論文都精準。但它只解釋了你為什麼覺得準,沒解釋你為什麼分享。

答案在神經科學裡。哈佛的研究發現,分享關於自己的資訊會啟動大腦中跟食物和金錢相同的獎賞迴路。這個效果強到受試者「寧願放棄 25% 的金錢報酬,也要有機會分享自己的想法」。Berger 在《Contagious》裡把這個現象框架為社交貨幣(Social Currency):「就像穿的衣服和開的車,我們談論的話題會影響別人對我們的看法。」

你在 IG 放你的 MBTI,不只是因為覺得準。是因為那四個字母讓你看起來像一個有自我覺察的人。你選的不只是準確度。社交形象也是動機的一部分,即使你自己不這樣覺得。每天的對話中有超過 40% 在談論個人經驗,社群媒體貼文有一半以「我」為中心。人格測驗的結果是完美的自我表達素材:簡短、有辨識度、而且不需要真的袒露什麼。

但 Wilson 的問題更根本:你可能根本不知道你為什麼分享。

Wilson 的研究反覆證明,當人被問到為什麼做某個選擇時,他們給出的解釋「往往和真實的心理原因無關」。他的經典研究之一:讓路人選四雙完全相同的絲襪中「品質最好」的一雙。受試者壓倒性地選了最右邊那雙。這是位置效應(position effect),跟品質無關。但被問到原因時,每個人都說出了跟品質有關的理由:織法比較好、彈性比較佳。沒有一個人提到位置。被直接問「位置有影響嗎?」時,幾乎所有人都露出懷疑的表情說:「當然沒有。」

Berger 和 Wilson 都有神經科學支撐,但結論看起來相反。其實他們量的不是同一件事。Berger 量的是你意識到的行為動機(社交策略),Wilson 量的是你意識不到的心理驅力(適應性無意識)。一個在問「你做了什麼」,另一個在問「你為什麼做」。

這不是二選一的問題。可能兩件事同時成立:你的大腦確實在用社交貨幣的邏輯運作(Berger 是對的),但你意識到的那個理由,「因為覺得有趣」「讓朋友了解我」,可能只是你的大腦編給你聽的故事(Wilson 也是對的)。

科學上最有效的人格測量,恰好最沒人想用

如果 MBTI 和 SBTI 都不科學,有沒有真正科學的替代品?

有。心理學界目前最有科學基礎的替代品是五大人格特質(Big Five):外向性、親和性、盡責性、神經質、開放性。Daniel Nettle 在《Personality》裡彙整了三層證據:跨文化因素分析反覆歸納出同樣五個維度,腦造影顯示對應的神經結構,雙胞胎研究發現約 50% 的人格變異來自基因。他的結論:五大人格是「有史以來最全面、最可靠且最有用的人格討論框架」。

五大人格跟 MBTI 最大的差別:它不給你標籤。它給你五個連續的刻度。你不是「INFJ」或「DEAD」,你是「盡責性在第 62 百分位、神經質在第 78 百分位」。沒有十六種人格,沒有最稀有的類型,只有你在五個量尺上的位置。這在科學上更誠實,因為真實的人不會剛好落在「內向」或「外向」的其中一邊。

這在科學上是更準確的描述。但沒有人會在 IG 自介放「我的神經質在第 78 百分位」。因為它不好笑、不酷、沒有辨識度。它沒有社交貨幣。

Paul 對五大人格也有批評。她引用心理學家 Dan McAdams 的話:五大人格只是「陌生人的心理學」,你剛認識一個人時用來快速分類的粗淺維度,但它碰不到一個人在壓力下怎麼反應、他的信仰、焦慮、和會隨時間改變的生命故事。Nettle 不同意,他認為這些批評低估了五大人格的生物學基礎。這場辯論對你的意義是:即使最科學的工具,也只能描述你的一部分。

但這場辯論真正值得記住的不是誰對誰錯。是這件事:科學上最有效的人格測量方式,恰好是最沒有傳播力的那個。 人們不分享五大人格結果,因為連續刻度沒辦法變成社交貨幣。MBTI 和 SBTI 會一直贏,不是因為更準,是因為更好分享。

紫微斗數用了幾千年的手法,1949 年才有人給它取名字

你的星座老師、你的紫微斗數師父、MBTI 官方、SBTI 的 B 站 UP 主,他們都在用同一個心理機制。Forer 只是第一個在實驗室裡證明它存在的人。

如果你是台灣人,你的人格測驗時間軸大概長這樣:國高中開始看星座運勢,記住每個朋友的星座,唐綺陽是每天必看的人。大學開始聽人講 MBTI,交友軟體自介放四個字母。2026 年 4 月朋友傳 SBTI 給你。你家長輩也許還會加一層:八字、紫微斗數、面相。算命師用的手法跟 Forer 的實驗完全一樣,只是他在 1949 年之前就已經用了幾千年。

每一個系統的運作方式都一樣:用足夠模糊的描述覆蓋大多數人,讓每個人覺得在說自己。差別只在包裝和時代。星座用天體,紫微斗數用出生時辰,MBTI 用四個二分法,SBTI 用迷因。這不是說這些系統沒有意義——你媽幫你算紫微的那天,她在乎的不是科學,是你。但讓你覺得「準」的那個機制,每個系統都一樣。

論壇上有個人寫得很誠實:「自己覺得算準的,也可以說是我想成為的樣子。」這句話同時說出了巴納姆效應(你覺得準)和 Akerlof 的身份效用(你選擇了一個讓你舒服的標籤)。

下一個版本的人格測驗一定會來。可能是 AI 算命,這已經在中國流行起來了,已經有人靠 AI 算命做到規模化的生意。用 ChatGPT 幫你算紫微斗數,用更精緻的演算法給你一個更個人化的標籤。但底層機制完全一樣:巴納姆效應 + 社交貨幣 + 你大腦的 feel-good criterion。

知道機制之後,你要怎麼用這件事

知道這些之後,有三件事我做了不同的選擇。

第一,我不再對人格測驗的結果認真。不是因為它不好玩,它確實好玩,當聊天話題用很方便。但我知道那個「準」的感覺不是來自測驗本身,是來自我大腦裡一個會自動接受正面描述的機制。知道機制不能讓你免疫,但至少讓你在覺得「超準」的時候多停一秒。

第二,我開始問自己:我分享這個結果的時候,是在了解自己,還是在經營形象?大多數時候答案是後者。Berger 說得對,分享是社交策略。知道這件事不代表你不能繼續分享,只是你比較不會騙自己。

第三,我對「了解自己」這件事變得更謹慎了。Wilson 的研究讓我相信:我們對自己的大部分了解都是事後建構的故事。問卷測不出你是什麼人。跑半馬的時候第十八公里你怎麼反應、客戶突然改需求你怎麼處理、凌晨兩點你在想什麼——這些比任何四個字母都更接近你是誰。但這些東西沒辦法變成一張截圖發到群組裡。

下次你做人格測驗的時候,你一定會做的,因為朋友會傳連結給你。結果出來,你會再讀一遍那段描述,心裡浮出同一句話:「怎麼這麼像我。」現在你知道那句話從哪裡來了。



本文讀了這些來源:

書:

聲明: 本文不構成心理健康建議。人格測驗的使用和解讀請自行判斷。


你可能也想讀:

下一篇分析完成時寄給你

沒有廢話,只有新文章。

認識也在想這個問題的人?轉給他,看你們判斷一不一樣。