SBTI 沒有科學根據，為什麼四千萬人還是覺得準？

SBTI 的 27 種人格描述全都聲稱「這是全中國最稀有的類型」，27 個類型每個都最稀有，數學上不可能成立。但做完的人不會算數學——他們在讀一段夠模糊又夠具體的描述，觸發的是 1949 年 Forer 實驗就證明的巴納姆效應：全班拿到同一份描述，平均打 4.2/5 的準確度。SBTI 創作者自己都說只是娛樂，但四千萬人的「準」不是來自測驗設計，是來自大腦天生偏好接受正面描述的機制。

MBTI 重測有一半的人變成不同類型，還值得信嗎？

根據美國國家研究委員會 1991 年評估，39% 到 76% 的人在五週到六年內重測會得到不同的人格類型。即使 MBTI 支持者自己的研究也顯示短期重測只有 47% 的人得到相同結果。有個研究者觀察到一名受測者「在下午是很好的直覺思考者，但在早上不是」。但 Emre 不同意直接否定——MBTI 的科學基礎脆弱，它創造的自我探索效果卻是真實的。不是偽科學這麼簡單。

人格測驗的「準」是真的準，還是大腦在騙你？

1949 年心理學家 Forer 讓全班學生做人格測驗，發給每個人「個別」的描述。學生平均打 4.2/5 的準確度，超過四成給滿分——但所有人拿到的是同一份從星座書拼湊的描述。Annie Murphy Paul 用巴納姆效應來解釋這個機制。Timothy Wilson 進一步解釋：大腦有一套「感覺良好準則」，會自動接受正面描述、忽略負面資訊。不是你太笨，是大腦在用一個對生存有利的機制去處理它不擅長辨別的東西。

最科學的人格測驗反而沒人用——Big Five 輸在哪裡？

Big Five 有三層科學證據：跨文化因素分析歸納出相同五個維度、腦造影發現對應神經結構、雙胞胎研究顯示約 50% 變異來自基因。Daniel Nettle 稱它是「有史以來最全面、最可靠且最有用的人格討論框架」。但沒人會在 IG 放「我的神經質在第 78 百分位」——因為它不好笑、不酷、沒有辨識度。科學上最有效的人格測量方式，恰好是最沒有傳播力的那個。MBTI 和 SBTI 會一直贏，不是因為更準，是因為更好分享。

你分享 MBTI 結果是為了了解自己，還是在經營形象？

哈佛研究發現分享關於自己的資訊會啟動大腦中跟食物和金錢相同的獎賞迴路，受試者寧願放棄 25% 的金錢報酬也要分享。Berger 把這框架為社交貨幣：人格測驗結果是完美的自我表達素材——簡短、有辨識度、不需要真的袒露什麼。但 Wilson 的研究顯示，你給出的分享理由（「因為很準」「讓朋友了解我」）可能只是大腦事後編造的解釋。Berger 量的是你意識到的行為動機，Wilson 量的是你意識不到的心理驅力——兩件事可能同時成立。

從星座到 MBTI 到 SBTI——工具一直換，你在找的是同一個東西嗎？

星座、紫微斗數、MBTI、SBTI 的運作方式都一樣：用足夠模糊的描述覆蓋大多數人，讓每個人覺得在說自己。差別只在包裝和時代。台灣人的時間軸大概是：國高中看星座運勢、大學開始用 MBTI、2026 年朋友傳 SBTI。長輩還加一層八字和紫微斗數——算命師用的手法跟 Forer 的實驗完全一樣，只是在 1949 年之前就用了幾千年。論壇上有人寫得誠實：「自己覺得算準的，也可以說是我想成為的樣子。」工具換了，但你在找的東西沒變。

AI 算命比傳統測驗更準，還是更會騙你？

AI 算命用大語言模型產出的文字，本質上跟其他人格描述一樣：足夠模糊、足夠正面、讓你覺得在說自己。差別是 AI 可以根據你提供的資訊做更精細的個人化標籤。但底層機制完全一樣：巴納姆效應加上社交貨幣加上大腦的感覺良好準則。它不是「更準」，是換了一個更現代的包裝。

MBTI 的發明者不是心理學家——這件事重要嗎？

Katharine Briggs 和 Isabel Myers 從未受過正式心理學訓練。Katharine 在 1923 年讀了榮格後把之前所有筆記燒掉、全面皈依榮格體系。Isabel 在自家廚房餐桌上讓孩子和他們的高中同學試做第一版問卷。當 ETS 統計學家試圖驗證時發現缺乏統計效度，Isabel 拒絕交出計分方式，理由是怕俄國人拿到後「美國和文明世界會消失」。ETS 首席統計學家的結論：MBTI 的理論「大部分是虛構的」。重要嗎？看你用它做什麼——當社交工具沒問題，但拿來做人生決策要三思。

知道巴納姆效應之後，人格測驗還要做嗎？

做。知道機制不能讓你免疫——你下次做完還是會覺得準。但你可以在那個「超準」的瞬間多停一秒：這是測驗真的描述了我，還是大腦在自動接受正面描述？另外值得問自己：分享結果的時候，是在了解自己，還是在經營形象？大多數時候答案是後者，Berger 說得對，分享是社交策略。知道這件事不代表你不能繼續分享，只是你比較不會騙自己。

問卷測不出你是什麼人——那什麼可以？

Wilson 的研究認為我們對自己的大部分了解都是事後建構的故事，內省更像用有限資訊寫自傳。問卷測不出你是什麼人。跑半馬的時候第十八公里你怎麼反應、客戶突然改需求你怎麼處理、凌晨兩點你在想什麼——這些比任何四個字母都更接近你是誰。但這些東西沒辦法變成一張截圖發到群組裡。

四千萬人做的測驗沒有科學根據——他們在找什麼？

你打開手機。朋友傳了一個連結，說「快去測 SBTI，超準」。

你點進去。題目有點好笑，不像 MBTI 那麼正經。做了三分鐘，結果出來了：一個你沒聽過的四字母代碼，配一段描述。你讀了一遍。

「⋯⋯欸，這好像真的蠻像我的。」

你截圖，發到群組裡。有人說跟你很像，有人說他測出來完全不同。你們討論了十分鐘。然後你繼續滑手機，忘了這件事。

如果你做過 MBTI，上面這個過程你應該很熟。就算你沒聽過 SBTI，MBTI 你一定做過，或至少被問過「你是什麼類型」。如果你更早一點，你用的是星座——翻運勢書、查配對、記住每個朋友的星座。工具換了，你做的事情沒變。

2026 年 4 月，微信指數顯示超過四千萬人搜尋了 SBTI。那是一個 B 站 UP 主做的迷因測驗，「SB」就是你想的那個意思。沒有心理學訓練、沒有科學基礎、創作者自己都說只是娛樂。但四千萬人做完之後的第一反應幾乎一樣：怎麼這麼像我。

為什麼？

同一份結果發給全班，準確度 4.2 分

你的大腦天生不擅長辨別這類描述。這不是猜測，是 1949 年就被證明的事。

心理學家 Bertram Forer 讓學生做完一份人格測驗，然後發給每個人「個別」的人格描述。學生用 0-5 分評估準確度，平均打了 4.2 分，超過四成的人直接給滿分。沒有人發現，所有人拿到的是同一份描述。

Forer 的那段文字是從報攤上的星座書拼湊出來的。裡面的句子長這樣：「你有時候外向、善於社交，有時候內向、謹慎。」「你對自己有些嚴格的要求。」「你雖然有些弱點，但通常能夠克服。」

這些句子的特點是：夠模糊到適用於所有人，又夠具體到讓每個人覺得在說自己。Annie Murphy Paul 在《The Cult of Personality Testing》裡解釋這個機制時用了一個詞：巴納姆效應（Barnum Effect）。P.T. Barnum 是十九世紀的馬戲團團長，他說過：最厲害的把戲是讓所有人都覺得在說自己。

SBTI 的 27 種人格描述全都聲稱「這是全中國最稀有的類型」。27 個類型，每個都是最稀有的。你不需要統計學學位就知道這在數學上不可能成立。但做完測驗的人不會算數學，他們在讀那段像在說自己的描述。

Paul 解釋了現象，但沒有回答一個更深的問題：為什麼你的大腦會上當？Timothy Wilson 在《Strangers to Ourselves》裡往裡追了一層：你的大腦有一套他叫做「感覺良好準則」（feel-good criterion）的過濾系統。它會在你不知道的情況下，選擇性地接受讓你感覺好的資訊，忽略不舒服的。人格測驗的結果通常是正面的、討喜的，而你的大腦天生就偏好接受正面描述。

巴納姆效應不是你太笨。是你的大腦在用一個正常的、對生存有利的機制，去處理一個它不擅長辨別的東西。

MBTI 的發明者不是心理學家——她不讓統計學家看計分方式

如果 SBTI 只是迷因，那 MBTI 呢？全球每年超過兩百萬人付費做 MBTI，財星五百大企業用它做人才管理——但 MBTI 的創造者都不是心理學家。這件事本身就值得停下來想一想。

Merve Emre 在《你是哪一型人？》裡追溯了完整的歷史。Katharine Briggs 和 Isabel Myers，Emre 寫道：「她們是自豪的妻子、母親兼家庭主婦，從未受過正式的心理學或精神醫學訓練。」Katharine 在 1923 年讀了榮格的《心理類型》之後，把自己之前所有的筆記全部燒掉，全面皈依榮格的體系。她對榮格的崇拜到了什麼程度？Emre 找到了 Katharine 寫的情色小說，關於一個病人愛上瑞士心理分析師的故事。她在客廳唱「榮格醫生萬歲」。

Isabel 後來把母親的理論做成問卷。她加了一個榮格原著裡沒有的維度（判斷/感知），在自家廚房的餐桌上讓孩子和他們的高中同學試做第一版。後來她找到費城的人力資源顧問 Edward Hay，開始把這份問卷賣給企業客戶。

當美國教育測驗服務社（ETS）的統計學家試圖正式驗證 MBTI 時，發現它的雙極量表缺乏統計效度。Isabel 的反應是拒絕交出計分方式，理由是怕俄國人拿到後「美國和文明世界會消失」。ETS 的首席統計學家最後的結論是：MBTI 的理論「大部分是虛構的」。

Paul 在她的書中提供了更精確的數據。根據美國國家研究委員會（NRC）1991 年的評估報告：在五週到六年的間隔內重測 MBTI，只有 24% 到 61% 的人維持相同類型。換句話說，39% 到 76% 的人會被分配到完全不同的人格類型。即使是 MBTI 支持者自己做的研究，也發現短期重測只有 47% 的人得到相同結果。超過一半的人會變成「另一種人」。

有個研究者在 NRC 報告裡留了一句很安靜的觀察：一名受測者「在下午是很好的直覺思考者，但在早上不是」。你的人格類型會因為你是上午還是下午做測驗而改變。

所以 MBTI 就是偽科學，別信了？

但 Emre 不同意這麼簡單的結論。

不科學的測驗，創造了科學測不到的東西

同一面鏡子碎成不同的碎片，每片映出不同的光——你看到的「自己」，取決於你拿起哪一片

比起直接否定，有一個更微妙的看法：MBTI 的科學基礎確實脆弱，但它創造的效果是真實的。Emre 追溯完整個歷史後的結論是：「儘管效度與信度都遭到質疑，在二十一世紀重生後的 MBTI 仍以強大的自我技術之姿，持續運作。」

什麼叫「自我技術」？Emre 認為 MBTI 給了人一套共同語言來描述自己。「我是 INFJ」比「我有時候很需要獨處但也喜歡深度對話」簡潔一百倍。這個標籤讓你在五秒鐘之內被一群陌生人「理解」，即使這個理解是表面的。

論壇上有人說得更直白：「聊天開話題用的，不要當真。」另一個人說：「就是個參考跟話題。」

經濟學對此有一個解釋：人類會主動選擇歸屬於某個社會類別，而歸屬這件事本身會帶來真實的效用。這是 Akerlof 和 Kranton 在《Identity Economics》裡的核心論點。「當人做自己認為應該做的事情時，他們是快樂的。」選擇一個 MBTI 標籤，就是選擇一個身份。這個身份告訴你什麼行為「像你」、什麼行為「不像你」。

但這裡撞上了 Wilson 的理論。如果人真的像 Wilson 說的那樣，我們對自己的了解大多是事後編造的，「人們建構的自我與非意識的自我幾乎沒有對應關係」——那 Akerlof 說的「效用」建立在什麼基礎上？

答案可能是這樣的：你不需要真的了解自己，就能從一個標籤裡獲得歸屬感。INTJ 描述的可能不是你真實的無意識人格，但你相信自己是 INTJ 並且據此行動，這件事本身讓你快樂了。快樂是真的。它的基礎是一個好故事，不是真相。

我自己做 MBTI 的經驗完全印證了 Emre 的觀察。前後做了好幾次才做完——不是因為題目難，是因為每個問題都覺得「兩邊都對」，很難認真回答。真正讓我做完的動力不是好奇心，是社交壓力：身邊的人一直問「你是什麼類型」，不知道的人反而尷尬。

結果出來，感覺不是驚喜，是確認：嗯，大概是這樣。真正讓我改觀的是後來它在社交場合的效率。對方一聽你的類型，就跳過了十分鐘的自我介紹。Emre 說 MBTI 是「自我技術」，但用起來更像社交壓縮檔——把一個人打包成四個字母，方便傳輸。

這件事不新。學生時期有人問「你什麼星座」，問的不是星座，是在找一個低成本的方式開始認識你。MBTI 把同一個社交功能換了更現代的包裝。SBTI 又換了一次。

你分享結果的真正原因，跟你以為的不一樣

論壇上有人說：「做完測驗再來對對對我就是這種人的話，其實你早就知道標準答案是什麼了。」

這句話比大多數心理學論文都精準。但它只解釋了你為什麼覺得準，沒解釋你為什麼分享。

答案在神經科學裡。哈佛的研究發現，分享關於自己的資訊會啟動大腦中跟食物和金錢相同的獎賞迴路。這個效果強到受試者「寧願放棄 25% 的金錢報酬，也要有機會分享自己的想法」。Berger 在《Contagious》裡把這個現象框架為社交貨幣（Social Currency）：「就像穿的衣服和開的車，我們談論的話題會影響別人對我們的看法。」

你在 IG 放你的 MBTI，不只是因為覺得準。是因為那四個字母讓你看起來像一個有自我覺察的人。你選的不只是準確度。社交形象也是動機的一部分，即使你自己不這樣覺得。每天的對話中有超過 40% 在談論個人經驗，社群媒體貼文有一半以「我」為中心。人格測驗的結果是完美的自我表達素材：簡短、有辨識度、而且不需要真的袒露什麼。

但 Wilson 的問題更根本：你可能根本不知道你為什麼分享。

Wilson 的研究反覆證明，當人被問到為什麼做某個選擇時，他們給出的解釋「往往和真實的心理原因無關」。他的經典研究之一：讓路人選四雙完全相同的絲襪中「品質最好」的一雙。受試者壓倒性地選了最右邊那雙。這是位置效應（position effect），跟品質無關。但被問到原因時，每個人都說出了跟品質有關的理由：織法比較好、彈性比較佳。沒有一個人提到位置。被直接問「位置有影響嗎？」時，幾乎所有人都露出懷疑的表情說：「當然沒有。」

Berger 和 Wilson 都有神經科學支撐，但結論看起來相反。其實他們量的不是同一件事。Berger 量的是你意識到的行為動機（社交策略），Wilson 量的是你意識不到的心理驅力（適應性無意識）。一個在問「你做了什麼」，另一個在問「你為什麼做」。

這不是二選一的問題。可能兩件事同時成立：你的大腦確實在用社交貨幣的邏輯運作（Berger 是對的），但你意識到的那個理由，「因為覺得有趣」「讓朋友了解我」，可能只是你的大腦編給你聽的故事（Wilson 也是對的）。

科學上最有效的人格測量，恰好最沒人想用

如果 MBTI 和 SBTI 都不科學，有沒有真正科學的替代品？

有。心理學界目前最有科學基礎的替代品是五大人格特質（Big Five）：外向性、親和性、盡責性、神經質、開放性。Daniel Nettle 在《Personality》裡彙整了三層證據：跨文化因素分析反覆歸納出同樣五個維度，腦造影顯示對應的神經結構，雙胞胎研究發現約 50% 的人格變異來自基因。他的結論：五大人格是「有史以來最全面、最可靠且最有用的人格討論框架」。

五大人格跟 MBTI 最大的差別：它不給你標籤。它給你五個連續的刻度。你不是「INFJ」或「DEAD」，你是「盡責性在第 62 百分位、神經質在第 78 百分位」。沒有十六種人格，沒有最稀有的類型，只有你在五個量尺上的位置。這在科學上更誠實，因為真實的人不會剛好落在「內向」或「外向」的其中一邊。

這在科學上是更準確的描述。但沒有人會在 IG 自介放「我的神經質在第 78 百分位」。因為它不好笑、不酷、沒有辨識度。它沒有社交貨幣。

Paul 對五大人格也有批評。她引用心理學家 Dan McAdams 的話：五大人格只是「陌生人的心理學」，你剛認識一個人時用來快速分類的粗淺維度，但它碰不到一個人在壓力下怎麼反應、他的信仰、焦慮、和會隨時間改變的生命故事。Nettle 不同意，他認為這些批評低估了五大人格的生物學基礎。這場辯論對你的意義是：即使最科學的工具，也只能描述你的一部分。

但這場辯論真正值得記住的不是誰對誰錯。是這件事：科學上最有效的人格測量方式，恰好是最沒有傳播力的那個。 人們不分享五大人格結果，因為連續刻度沒辦法變成社交貨幣。MBTI 和 SBTI 會一直贏，不是因為更準，是因為更好分享。

紫微斗數用了幾千年的手法，1949 年才有人給它取名字

你的星座老師、你的紫微斗數師父、MBTI 官方、SBTI 的 B 站 UP 主，他們都在用同一個心理機制。Forer 只是第一個在實驗室裡證明它存在的人。

如果你是台灣人，你的人格測驗時間軸大概長這樣：國高中開始看星座運勢，記住每個朋友的星座，唐綺陽是每天必看的人。大學開始聽人講 MBTI，交友軟體自介放四個字母。2026 年 4 月朋友傳 SBTI 給你。你家長輩也許還會加一層：八字、紫微斗數、面相。算命師用的手法跟 Forer 的實驗完全一樣，只是他在 1949 年之前就已經用了幾千年。

每一個系統的運作方式都一樣：用足夠模糊的描述覆蓋大多數人，讓每個人覺得在說自己。差別只在包裝和時代。星座用天體，紫微斗數用出生時辰，MBTI 用四個二分法，SBTI 用迷因。這不是說這些系統沒有意義——你媽幫你算紫微的那天，她在乎的不是科學，是你。但讓你覺得「準」的那個機制，每個系統都一樣。

論壇上有個人寫得很誠實：「自己覺得算準的，也可以說是我想成為的樣子。」這句話同時說出了巴納姆效應（你覺得準）和 Akerlof 的身份效用（你選擇了一個讓你舒服的標籤）。

下一個版本的人格測驗一定會來。可能是 AI 算命，這已經在中國流行起來了，已經有人靠 AI 算命做到規模化的生意。用 ChatGPT 幫你算紫微斗數，用更精緻的演算法給你一個更個人化的標籤。但底層機制完全一樣：巴納姆效應 + 社交貨幣 + 你大腦的 feel-good criterion。

知道機制之後，你要怎麼用這件事

知道這些之後，有三件事我做了不同的選擇。

第一，我不再對人格測驗的結果認真。不是因為它不好玩，它確實好玩，當聊天話題用很方便。但我知道那個「準」的感覺不是來自測驗本身，是來自我大腦裡一個會自動接受正面描述的機制。知道機制不能讓你免疫，但至少讓你在覺得「超準」的時候多停一秒。

第二，我開始問自己：我分享這個結果的時候，是在了解自己，還是在經營形象？大多數時候答案是後者。Berger 說得對，分享是社交策略。知道這件事不代表你不能繼續分享，只是你比較不會騙自己。

第三，我對「了解自己」這件事變得更謹慎了。Wilson 的研究讓我相信：我們對自己的大部分了解都是事後建構的故事。問卷測不出你是什麼人。跑半馬的時候第十八公里你怎麼反應、客戶突然改需求你怎麼處理、凌晨兩點你在想什麼——這些比任何四個字母都更接近你是誰。但這些東西沒辦法變成一張截圖發到群組裡。

下次你做人格測驗的時候，你一定會做的，因為朋友會傳連結給你。結果出來，你會再讀一遍那段描述，心裡浮出同一句話：「怎麼這麼像我。」現在你知道那句話從哪裡來了。

本文讀了這些來源：

書：

The Cult of Personality Testing — Annie Murphy Paul
你是哪一型人？ — Merve Emre
Strangers to Ourselves — Timothy D. Wilson
Contagious — Jonah Berger
Personality — Daniel Nettle
Identity Economics — George Akerlof、Rachel Kranton

聲明： 本文不構成心理健康建議。人格測驗的使用和解讀請自行判斷。

你可能也想讀：

你的投資判斷可能不是你的 — 同一條認知偏誤線：你以為你在思考，其實你在選擇相信誰
你的身份卡住了嗎？ — 如果測驗的標籤讓你舒服，可能正在阻止你變成下一個版本的自己
什麼時候該離開？ — 不是分類問題，是決策問題：你要怎麼判斷該繼續還是該走

四千萬人做的測驗沒有科學根據——他們在找什麼？

同一份結果發給全班，準確度 4.2 分

MBTI 的發明者不是心理學家——她不讓統計學家看計分方式

不科學的測驗，創造了科學測不到的東西

你分享結果的真正原因，跟你以為的不一樣

科學上最有效的人格測量，恰好最沒人想用

紫微斗數用了幾千年的手法，1949 年才有人給它取名字

知道機制之後，你要怎麼用這件事

你讀了《原子習慣》為什麼還是沒改變

副業到底值不值得做？專注派和多角化派吵了兩千頁，答案在你身上

你的大腦 38 歲開始轉型——這是衰退還是重組？

同一份結果發給全班，準確度 4.2 分

MBTI 的發明者不是心理學家——她不讓統計學家看計分方式

不科學的測驗，創造了科學測不到的東西

你分享結果的真正原因，跟你以為的不一樣

科學上最有效的人格測量，恰好最沒人想用

紫微斗數用了幾千年的手法，1949 年才有人給它取名字

知道機制之後，你要怎麼用這件事

下一篇分析完成時寄給你

你讀了《原子習慣》為什麼還是沒改變 →

副業到底值不值得做？專注派和多角化派吵了兩千頁，答案在你身上 →

你的大腦 38 歲開始轉型——這是衰退還是重組？ →

你讀了《原子習慣》為什麼還是沒改變

副業到底值不值得做？專注派和多角化派吵了兩千頁，答案在你身上

你的大腦 38 歲開始轉型——這是衰退還是重組？