MiniJudge FAQ

MiniJudge FAQ

Content last updated on June 16, 2006

1.極簡化實驗句法學

1.1 非正式的判斷收集方式真的一無可取?
1.2 該如何處理"無法確定"的句子?
1.3 為什麼不直接比較一組句子?

2. 使用MiniJudge

2.1 如何處理受試同意書?
2.2 為什麼不直接讓MiniJudge自動發送問卷?

1.1 實驗句法學的目的應該是改進收集受試者判斷的方式，但難道句法學家這幾十年來所收集的語料及文獻都是錯誤並該捨棄不用的嗎？

當然不是。非正式的方法有其保存的重要性，不該完全被一些更複雜的方式所取代。這類非正式的方法在科學發展上扮演了一定的角色。由於科學論證的目的首先必須要能取信於立論者的周遭人士，形式上要求的程度也因此取決於該社群自己的標準。許多已經為人們所深信的學術成果最初是以在當今連同儕評審都無法通過的方式發表。而連最不正式的實驗方法（如：根據每日所做的觀察做出理論上的推論），也有可能非常具有信服力。許多語言學的論證常有思考式實驗的特色，也就是以某個語言為母語的人被要求靠著自己的語感來驗證一些句法學家做出的判斷。由於測試上的便利，傳統的"語言學實驗結果"常可被複製數倍多於其他需要更精確的實驗方法的學門所發現的結果。最後，資源受限的問題：一個一個實驗一些看起來在明顯不過的句子實在非常耗費時間與體力。

即便如此，語言學家應該要意識到其他認知科學的領域並不是只為了某種偏執而使用複雜的實驗方法，而是經由兩世紀的發展後發現人類心靈以難以探測及行為表現的混雜而做出的應變。行為學派的失敗肇因於只靠表面的行為就想研究人類的心理，而心靈主義者的立論最為心理學家及神經學家所詬病的就是這些立論缺乏一個能連結行為與心靈的模型。語言學家對於心理方面的模型（語法理論及其包含的成分）已有高度研究，並認同語言能力（心靈）與語言表現（行為）不能混為一談的說法。然而，語言學家對於發展連結語言能力和語言表現的模型似乎完全沒有興趣。而相應的結果就是，語言學家無法發現某些對於他們來說是再明顯不過的證據其實可能只不過是由偏見導致甚至是錯誤的。某個心理學家可能會因為這種不可靠的態度而認為所有的語料都該受到質疑。然而，諸如此類的回應不止無法反駁任何上一段中提到語料仍有其可信度的論述，甚至過於偽善。有句話說：『所有實驗都有缺陷。』，一篇心理學的文章中推測及辯駁的部分通常也並不少於一篇語言學類的文章。

簡單來說，方法的嚴謹程度應該取決於研究所著眼的現象的細微程度。若你想要瞭解更多相關資訊，請參考這裡和這裡。

1.2 語言學上的可接受度並不單單只有是/否兩個答案，但為何極簡化實驗句法學只允許是或否兩種判斷呢？難道這樣不會遺漏資訊或導致受試者做出奇怪或受到偏見影響的判斷嗎？

這個問題在這裡已經詳細討論過了。簡單來說，二分式的判斷可以提供的資訊可能超出想像的多，且這種方法導致的偏見可能會比加上第三個"無法判斷"來的少。

1.3 大家都知道受試者的判斷在直接比對兩個類似的句子的時候最為敏銳，這也是句法研究通常一次呈現一組例句讓讀者更能瞭解其中差別的原因。但為什麼實驗句法學家堅持要讓實驗句隨機出現，一次只出現一句而非一組？

使用這種方法最根本的理由在於實驗句法學家通常承襲心理語言學測試句子的方式：讓句子單獨出現來反應現實情況。也就是說，和句法最相關的仍是單一句子本身而非一個句組，因此最小的測試單位仍然應該是句子，而尋找言談中才能展現的特質則該將目標句加上幾句其他的句子一同測試。嚴格來說，甚至以比較許多不同句子來做出推論的優選理論也並未在現實中依靠受試者的比較來做出推論。

更進一步地來說，要求受試者以句組為最小單位做判斷不止沒有必要，甚至會有負面的影響：對於句組中的任何句子來說，其他的句子提供了一個用來判斷這個句子的背景。若實驗只包含了某些特定句型的句組，則原本定義為實驗變因的句組內部差異所產生的效果將會與句組所提供的背景產生的效果混淆。這種實驗方式因此將無從得知實驗者收集到的判斷中所出現的差異是肇因於句子本身（也就是句法理論所偏重的部分）抑或是因為以句組的方式呈現而產生的差異。事實上，即使兩個句子並沒有可接受度上的差異，以句組呈現這兩個句子的方式也相當有可能誤導受試者。受試者可能會抱著『這兩個句子一定存在的某些差異，不然它們不會被放在一起比較』的心態而虛擬出兩個句子之間事實上並不存在的差異。對於背景在判斷上造成的影響所做的研究同時也解釋了為什麼句法實驗通常讓實驗句以隨機的方式出現。更多有關極簡實驗句法學中隨機順序的資訊請看這裡。

但是這是否代表著一般句法研究中以句組呈現句子之間的差異的方法是大錯特錯呢？一點也不！一個判斷句子的實驗必須由數組內部句子之間存在著差異的句組組成，不然這個實驗的設計就會出現漏洞。一個實驗必須允許一個理論上值得討論的變因存在，並控制其他的變因。而一組內部句子存在著差異的句組正是個很好的實驗設計。 (更多有關變因設計的資訊，請看這裡) 此外，以句組來測試在非正式的實驗方法上還有另一個重要性：在一個極度傾向句子之間存在差異的背景下若還無法發現任何差異，則可能這兩個句子之間實際上並沒有差異。

2.1 靠著我自己或是一兩位同事的語感來測試句子可能也算是種實驗，幸好我所在的學校當局並不這麼想。若想從事真正的句法實驗，我必須要先經由學校的人類受試者審查委員會審核通過才能進行實驗。因此若我想從事真正的句法實驗，這個免去繁雜的審查程序的便利性不就沒有了？

或許是這樣。事實上，實驗的正式或非正式之間並沒有明確的區隔，而語言學家長期以來靠著詢問電子郵件上的聯絡人來獲得判斷的資料的確省去了不少公文作業的時間。然而，當你必須提出有關統計上的 p值和諸如此類的東西時，學校當局要求你提出受試者的受試同意書及相關資料也是很合理的。當你的受試者只是從電子郵件上的聯絡人找出而非實地去招募受試者時，這方面的要求的確十分令人困擾。幸運的是，句法判斷實驗（特別是以MiniJudge 之類的工具執行的實驗）幾乎都有著同樣的特性，像是：這些實驗都不會對人造成傷害，也不會侵犯任何人的隱私，更不會花上非常久的時間完成。所以你應該可以多次利用同樣的受試者同意書而不必根據實驗內容的不同修改同意書。當你藉由電子郵件執行實驗時，一個被接受的作法是隨實驗問卷附上一份可簽署（可編輯的文字檔案）的電子同意書。或是你也可以在實驗指導語的部分加上一句" 若你回傳這份問卷，則代表你瞭解並同意..."。當然要求使用者簽署同意書的確是擾人且不特別有意義，但若因此就放棄採用極簡化句法實驗就太可惜了。

2.2 散發電子郵件讓我們可以很方便的收集並分析判斷，但MiniJudge還是要求使用者必須一封一封地發出郵件。為什麼不在MiniJudge上加入可以自動散發一份問卷到一個電子郵件位址的功能呢？

自動散佈的郵件叫做垃圾信件。

若有對程式的問題或建議，請聯絡本程式作者麥傑

若對網頁中文化有問題或建議，請聯絡中文化作者