【高考特輯】2014年高考作文預測靠譜嗎?

很多中學老師認為高考題目是可以預測的 , 他們聲稱自己能感覺到出題的趨勢 , 并且在考前幫著學生押題 。 我上學的時候總覺得押題是個不靠譜的事 , 難道出題的人沒有自由意志嗎?事實是 , 我們都沒有自由意志 。

【高考特輯】2014年高考作文預測靠譜嗎?



百度最近出了個新東西 , “百度預測” , 目前提供針對世界杯、城市、景點和高考四大項目的預測 。
【高考特輯】2014年高考作文預測靠譜嗎?



尤其在高考方面 , 百度通過數據分析認為[1]2014年高考作文題目將會出現在“時間的饋贈”、“生命的多彩”等六個領域之中 , 并且給出了各領域命中的精確概率 。 直接告訴你高考作文題是什么當然不可能 , 但是有了這個范圍 , 學生們需要準備的話題就從無限多變成有限多了 。 百度說這個預測是“基于海量作文范文和搜索數據” 。 各領域下列舉的作文題目關鍵詞 , 比如“時間的饋贈”中的關鍵詞包括“記憶”、“未來”、“成長”、“忘記”等 , 都是中學生作文的常用詞 。
【高考特輯】2014年高考作文預測靠譜嗎?



也就是說 , 百度用數據分析預測出來的高考作文題 , 都是最常見的作文題 , 都是俗套 。 換句話說 , 用數據分析搞預測的隱含假設是未來事件會繼續落入最近流行的俗套 。
可是高考出題的人有必要尊重俗套嗎?難道出《讓未來記住今天》或者《守住心靈的那扇門》這種俗不可耐的題目不是可恥的嗎?在回答這個問題之前我們先研究一個更大的問題:到底什么樣的東西是可預測的 , 什么樣的東西是不可預測的 。
最近幾年美國出了一位預測牛人 , Nate Silver 。 美國人很喜歡體育數據 , 有些棒球雜志上更是連篇累牘全是各種細致的數據 。 Silver基于統計模型 , 自己搞了個軟件來通過分析職業棒球的數據去預測各個球員未來的表現 。 結果他的預測結果超越了所有最有經驗的球探 。 不但如此 , 他的政治預測成績更令人瞠目結舌 。 2008年大選 , 對各州總統選舉結果 , 50個州Silver預測對了49個;對35個參議員席位 , Silver全部命中 。 更關鍵的是 , 他的預測跟政治專家的預測相差極大——事實證明聽專家的遠遠不如聽數據分析的 。 Silver 2012年出了本書 , The Signal and the Noise(《信號與噪聲》) , 談預測的學問 。
Silver在書里說 , 你別看我預測水平高 , 其實我預測的東西是容易預測的 。 比如說棒球 , 我們都知道這個比賽相當沉悶外行看著感覺一點都不熱鬧 。 棒球的特點恰恰是運動員具有相當的獨立性 。 一個球員的水平是什么樣就是什么樣 , 他對球隊的貢獻非常穩定 , 并不怎么依賴隊友的發揮和對手的表現 , 場上的隨機因素也比較少 。 相對而言足球就不是這樣 , 一個球員水平再高也得依賴隊友、教練和對手 , 甚至包括裁判 , 有時候一著不慎滿盤皆輸 。
關鍵在于 , 像棒球這樣的簡單系統 , 里面沒有連鎖反應 。 我們都聽過一個笑話說拿破侖之所以在滑鐵盧戰敗是因為他穿了緊身褲 。 緊身褲導致拿破侖得了痔瘡 。 痔瘡導致他在戰斗的關鍵時刻未能居中指揮……這就是連鎖反應 。 連鎖反應通常是正反饋的過程 , 每一環帶來的破壞都可能比上一環更大 , 而且都可能直接激發下一環 。 對預測者來說更麻煩的是這種反應充滿偶然 , 大多數情況下反應不了幾環就會終止 , 有時候卻可能導致大麻煩 。
簡單的系統容易預測 , 因為一個個體哪怕出點預測范圍以外的波動 , 對整個系統也不會有大影響 。 而如果一個系統中包含各種正反饋機制 , 它就是不好預測的復雜系統 , 一個個體的小波動就有可能通過連鎖反應層層放大出現蝴蝶效應 。 比如現代金融體制就是一個復雜系統 。 地產下跌可能會導致人們還不起房貸 , 房貸還不上會導致銀行受不了 , 銀行一收緊信貸其它行業又受不了 , 最后可能就是大規模的金融危機 。 Silver說 , 那些信用評級機構 , 給這個評個AAA , 給那個評個AA+ , 這些所謂評級都是根據市場“正常”情況下的數據分析而來 , 可是一旦發生連鎖反應 , 市場就不正常了 , 你的那些數據就根本沒用!復雜系統 , 是可能出“黑天鵝”的系統 。

猜你喜歡