棒球統計學(sabermetrics,又稱賽博統計學)是最近二十年在美國職棒興起的一門方法,用統計學/計量經濟學的方式,取代傳統的指標來評估棒球員的價值。過去習慣於使用的打擊率等指標,被認為無法正確反應球員的能力。
而在這波計量經濟學式的熱潮後,變得最廣為人知的數據是:OPS(OBP=上壘率+SLG=長打率)
這個數據之所以受到廣泛使用,是因為其計算簡單(上壘率跟長打率都是很純粹亦得的統計數據)並且經濟意義直覺明確(打者上壘能力+長打能力),因此就算是一個討厭計算數據的傳統老教練,理論上都學得會這個數據。但諷刺的是,這個統計指標本質上的謬誤之大,正好與棒球統計學試圖正確還原解釋球員價值的本意相互違背。
上壘率的分母是打席數而長打率的分母是打數,相加之後不進行通分的話是沒辦法得出一個有意義的數據,因此將之進行通分後可以得到這樣的概略結果:
(安打+保送)/(打數+保送) + (安打*平均長打數)/(打數)
=[ 安打+保送+安打*平均長打數*(打數+保送)/打數]/(打數+保送)
長打率變成 [安打*平均長打數*(打數+保送)/打數]/(打數+保送)這個形式的再表示形式。意思就是,如果我們把打數放大成打席數的話,這個數據的意思是:上壘率加上假設打數被放大到跟打席一樣大的長打率。或者換句話說,是這個打者每次上場打擊時,可以產生的相同效用的平均壘打數。但不幸的是在這個式子中所有的安打的壘打數都被加了1,因此安打與保送之間的權重都至少是兩倍起跳。先不提為什麼長打數的計算要被打席數與打數的倍數給放大這個詭異的情況,一壘安打真的有保送的兩倍重要嗎?全壘打是保送的五倍重要嗎?這個式子並不是用"道理"推出來的,而是計算方便就湊合出來的。
因此,一個打擊率尚可並且非常會打全壘打(SLG=.460),但是上壘率卻不忍卒睹(OBP=.300)、通常是被擺在後段棒次的打者,他的OPS卻是可能高於一個上壘率不錯(OBP=.350),但是打的球是平飛球居多,全壘打非常少的打者(SLG=.400)-一個優秀的第一棒常見的條件。
這是因為權數的扭曲製造出來的問題,但OPS的設計並不是刻意扭曲了權數,而是一個方便計算的數據,在簡單易懂的強力經濟直觀下被發明的。同時考慮上壘能力跟長打力,並且只要將兩個數據相加,這是多麼方便的新工具,但卻有著根本上的謬誤。
這種因為計算方便而被設計出來,無法解釋數據代表意義,甚至對與其中各個元素的權數賦予奇怪加權的可怕數據四處都存在,比如社交網站霸主FACEBOOK遠勝其他競爭者的數據:
ARO(AccessRatingOnline)值
用以評估目標網站之總體表現的衡量指標,為綜合考慮三種衡量網站表現的因素(包含廣度、忠誠度與黏度)之數值。
ARO = 到達率 ╳ Web連線到達率
╳ 單次造訪停留時間
這個數據若是只看後半段,可以得出每有一個人上網,這個人停留在該網站的期望停留時間這樣的意義。但為了所謂的"廣度"而多乘了一次不重複使用者的到達率,導致這個數據變成無法解釋其經濟意義的怪物。
由於FACEBOOK本身規模之龐大,使其不論是在哪個指標都勝過大多數網站,這三個指標自是高於平均許多,FACEBOOK本身社交網站的性質,更使得大多數使用者都是開了網頁以後就讓該網頁閒置,實際上並沒有在做什麼有意義的瀏覽,衝高了停留時間。更何況是將這數據與多一個到達率相乘後的結果-那些小規模的特殊用途網站自然無法與FACEBOOK相比。
表一:總廣告曝光數量遠勝群雄的facebook
Top 10 U.S. Online Display Ad* Publishers Q1 2011 Total U.S. – Home/Work/University Locations Source: comScore Ad Metrix |
||
Total Display Ad Impressions (MM) | Share of Display Ad Impressions | |
Total Internet : Total Audience | 1,110,448 | 100.0% |
Facebook.com | 346,455 | 31.2% |
Yahoo! Sites | 112,511 | 10.1% |
Microsoft Sites | 53,592 | 4.8% |
AOL, Inc. | 33,454 | 3.0% |
Google Sites | 27,993 | 2.5% |
Turner Digital | 18,050 | 1.6% |
Fox Interactive Media | 11,697 | 1.1% |
Glam Media | 10,207 | 0.9% |
CBS Interactive | 9,208 | 0.8% |
Viacom Digital | 9,051 | 0.8% |
(註:Google Sites僅包含一部分google廣告業務如youtube等網站的曝光數,不包含搜尋關鍵字廣告)
不幸地是,這些小網站的營利模式,是可能遠較FACEBOOK優秀的。
一個公司在營運是除了考慮總營收以外,總成本以及相對應規模的資金成本也是需要考量的。特別是對於一個欠缺可以輕易變現的資產,絕大多數是"或有資產"的網路業者而言,資金成本並不如石油業或是鋼鐵業來得穩定而低廉。而龐大的營收規模,亦意味著需要較高的固定成本來支應-甚至包含龐大的訴訟成本。
如果是要投資這間公司,ARO(或是諸如女性比率,每天總發文數量)這類極度優異的數據沒有任何意義-但有趣的是很多人為了說明FACEBOOK有多偉大,總是拿這些數據來說明它的股價將會如何一飛沖天,應該會是雅虎的四倍以上。
這類數據真正的用途,是在FACEBOOK的客戶想要下廣告時,要參考其廣告效益的衡量指標。不幸地是ARO對於廣告客戶的效益,亦是有著嚴重的偏誤。每次有人連上網路時,開啟FACEBOOK網頁的機率對於廣告者而言自然是越高越好,但停留時間卻否-比如一個專門販賣電子產品的購物網站,其停留時間跟到達率可能遠遜於FACEBOOK,但對於一個需要廣告電子產品,或是其他客戶具有相關性產品的廠商而言,FACEBOOK顯然是一個華而不實的網站。
另外,FACEBOOK上高收入使用者的比率偏低-甚至低於性質類似的推特跟G+,幾乎是所有大型社交網站中最低的一個。這些使用者亦往往是停留時間最少的族群,FACEBOOK顯現的漂亮指標,其實很可能是由最沒有消費能力的族群所支撐起來的。真正會點擊廣告、並且在點擊後採取廣告主希望的後續行動的使用者,並不如FACEBOOK略高於平均的點擊率來得漂亮。一個每天在FACEBOOK上玩小遊戲超過一個小時的國中生,就算會去點擊奧迪汽車的廣告,實際上他真正會產生實質貢獻的是點擊FACEBOOK上其他朋友按過讚的免費網路遊戲廣告,並且不花錢買虛寶玩下去。
這種使用者對於FACEBOOK的各項指標都有了顯著的貢獻,但卻不能真正反應廣告主想要的廣告宣傳能力。奧迪汽車並不需要純粹地"曝光"並且讓人觀看他們的廣告頁,他們需要的是讓會買他們車的人看到廣告,並且因此想買他們的車。不幸地是,消費力較差的族群反而被乘上遠遠較大的權重-平均停留時間。在FACEBOOK台灣下一個數位單眼相機的廣告,效益可能要比在Mobile01都要差得多,更不要說是其他高消費性產品。
更糟糕的是FACEBOOK這類的網路廣告服務商有所謂的點擊率優化的設計。同樣期間內有五個廣告輪流在網頁上撥放,FACEBOOK的演算法會以"優化點擊率"為目標,動態調整這五支廣告的撥放頻率。本身就極具吸引力的廣告-比如電影的預告片其點擊率其實遠遠高於可笑的三流網路遊戲的點擊率,甚至有十倍之譜。
在動態調整的過程中FACEBOOK會不斷提高高點擊率廣告的撥放頻率,並且爛乏味廣告的頻率下降,總撥放期間拉長(其廣告計價方式是,廣告主願意投放的預算除以每次點擊的成本,因此越沒人點擊,這個廣告預算就會越久才被消耗掉)。這種優化過程自然是為了修飾點擊率,但不幸地是產生了雙重矛盾。
首先是看到FACEBOOK優秀點擊率的廣告主,大多數真正得到的點擊效應是較這個數據有一定落差的低。而少數較平均高的廣告主,它的廣告會出現類似"惡意消化預算"的結果,在極短的時間內預算被極高的點擊率給消化完畢。廣告主沒有辦法像傳統媒介的電視報紙廣告一樣正確掌握撥放期間跟頻率,但FACEBOOK定價是用他高得離譜的流量與點擊率去吹噓其廣告效力。
這就是通用汽車所謂的"廣告效益不彰"。這麼高的點擊數怎麼會不彰?因為不但吸引不太到真正的客群因為這個廣告而消費;如果廣告本身做得太成功很吸引人,FACEBOOK雖然會對這個廣告毎個點擊次數的單價給予折扣,但卻會強制提高這個廣告的曝光頻率-要知道真正會買車的人佔FACEBOOK使用者的比率已經夠低了,就算一開始打算盡可能投放在有興趣的使用者身上,但提高頻率的結果就是讓曝光數被更多不會消費此產品的人在短時間內給消耗掉。
優化演算法是對FACEBOOK有利,但對廣告主是有如惡意消化預算一樣的設計,不吸引人的廣告其出現頻率被降低、撥放期間拉長,優秀的廣告一下子就被燒光預算,高於總平均的0.05(%)點擊率(CTR)實際上效益並不比所謂的平均來得好,FACEBOOK沒有辦法把廣告正確投放出去,效益甚至可能比在第四台的韓劇節目撥放冷氣廣告還差-至少我們知道看的人是媽媽居多。
FACEBOOK並不像Google廣告一樣可以直接靠著網站性質,區分出沒有明確被賦予偏好的使用者-愛看財經網站的人自然對於真的基金較有興趣,儘管他的興趣可能寫的是網球。在汽車的討論區下廣告,自然更容易抓到那些正好想買車,因此搜尋到這個網站後進來看參考評價的使用者的眼球。但FACEBOOK沒有辦法精準地讓使用者自投羅網,因此跟google ad一樣進行優化演算後反而會得出悲劇的結果。google的優化演算是在同屬性的廣告撥放群組中優化,不是對著某個觀看者混雜的版面優化,不會有FACEBOOK優化會有的缺點。
而FACEBOOK最大的優勢-"你的朋友說這個讚"廣告,亦因此不如在各個本身就具有消費者區隔效用的網站上下G+的"你的朋友對這個+1"廣告。FACEBOOK大而龐雜,但零碎的網路廣告市場早已被Google接近獨占地控制,社交網站要勝過真正專業的搜尋引擎,可以說是癡人說夢。
G+怕FACEBOOK嗎?恐怕正好相反!因為G+能產生的經濟效益是遠勝過FACEBOOK的!因為FACEBOOK有著跟它的流量不成比例地低的廣告效益。 相反地,google實現了經濟學中認為最好的狀況:不要想辦法區分客戶有多少消費能力,讓客戶自己在自己身上貼標籤,你就可以把產品正確地呈現給不同屬性的客戶。會看這個網誌的人,本身自然對理財或政治較有興趣,並且會為此主動蒐集資訊,google因此可以遠比facebook更準確地投放廣告。
將各種不同用途的使用者聚集在一個名為社交的場合,總合的效益反而降低,FACEBOOK在承受一樣大的流量的情況下,廣告的效益恐怕是遠遠遜於分進合擊的google adword。FACEBOOK該怎麼辦?如果真被G+發展出夠大的規模,FACEBOOK的廣告市場被侵蝕的情況是可能會遠高於市佔率的萎縮的。
FACEBOOK真的有其總曝光數佔有率超過30%那麼強嗎?不幸地是,google ads的投放率要精準地多,丟在各個零碎網站的聯播網CTR平均約有0.3~0.4,整體甚至高達0.7%(附帶一提這個網誌約為0.3),而且這些點擊還更能準確地投放在能真正對應需求的使用者身上。曝光數、總流量真的顯示出FACEBOOK稱霸無人能敵嗎?恐怕巨大的流量無法帶來等幅度的有效廣告曝光,是FACEBOOK的沉重負擔才是。
這種使用者對於FACEBOOK的各項指標都有了顯著的貢獻,但卻不能真正反應廣告主想要的廣告宣傳能力。奧迪汽車並不需要純粹地"曝光"並且讓人觀看他們的廣告頁,他們需要的是讓會買他們車的人看到廣告,並且因此想買他們的車。不幸地是,消費力較差的族群反而被乘上遠遠較大的權重-平均停留時間。在FACEBOOK台灣下一個數位單眼相機的廣告,效益可能要比在Mobile01都要差得多,更不要說是其他高消費性產品。
更糟糕的是FACEBOOK這類的網路廣告服務商有所謂的點擊率優化的設計。同樣期間內有五個廣告輪流在網頁上撥放,FACEBOOK的演算法會以"優化點擊率"為目標,動態調整這五支廣告的撥放頻率。本身就極具吸引力的廣告-比如電影的預告片其點擊率其實遠遠高於可笑的三流網路遊戲的點擊率,甚至有十倍之譜。
在動態調整的過程中FACEBOOK會不斷提高高點擊率廣告的撥放頻率,並且爛乏味廣告的頻率下降,總撥放期間拉長(其廣告計價方式是,廣告主願意投放的預算除以每次點擊的成本,因此越沒人點擊,這個廣告預算就會越久才被消耗掉)。這種優化過程自然是為了修飾點擊率,但不幸地是產生了雙重矛盾。
首先是看到FACEBOOK優秀點擊率的廣告主,大多數真正得到的點擊效應是較這個數據有一定落差的低。而少數較平均高的廣告主,它的廣告會出現類似"惡意消化預算"的結果,在極短的時間內預算被極高的點擊率給消化完畢。廣告主沒有辦法像傳統媒介的電視報紙廣告一樣正確掌握撥放期間跟頻率,但FACEBOOK定價是用他高得離譜的流量與點擊率去吹噓其廣告效力。
這就是通用汽車所謂的"廣告效益不彰"。這麼高的點擊數怎麼會不彰?因為不但吸引不太到真正的客群因為這個廣告而消費;如果廣告本身做得太成功很吸引人,FACEBOOK雖然會對這個廣告毎個點擊次數的單價給予折扣,但卻會強制提高這個廣告的曝光頻率-要知道真正會買車的人佔FACEBOOK使用者的比率已經夠低了,就算一開始打算盡可能投放在有興趣的使用者身上,但提高頻率的結果就是讓曝光數被更多不會消費此產品的人在短時間內給消耗掉。
優化演算法是對FACEBOOK有利,但對廣告主是有如惡意消化預算一樣的設計,不吸引人的廣告其出現頻率被降低、撥放期間拉長,優秀的廣告一下子就被燒光預算,高於總平均的0.05(%)點擊率(CTR)實際上效益並不比所謂的平均來得好,FACEBOOK沒有辦法把廣告正確投放出去,效益甚至可能比在第四台的韓劇節目撥放冷氣廣告還差-至少我們知道看的人是媽媽居多。
FACEBOOK並不像Google廣告一樣可以直接靠著網站性質,區分出沒有明確被賦予偏好的使用者-愛看財經網站的人自然對於真的基金較有興趣,儘管他的興趣可能寫的是網球。在汽車的討論區下廣告,自然更容易抓到那些正好想買車,因此搜尋到這個網站後進來看參考評價的使用者的眼球。但FACEBOOK沒有辦法精準地讓使用者自投羅網,因此跟google ad一樣進行優化演算後反而會得出悲劇的結果。google的優化演算是在同屬性的廣告撥放群組中優化,不是對著某個觀看者混雜的版面優化,不會有FACEBOOK優化會有的缺點。
而FACEBOOK最大的優勢-"你的朋友說這個讚"廣告,亦因此不如在各個本身就具有消費者區隔效用的網站上下G+的"你的朋友對這個+1"廣告。FACEBOOK大而龐雜,但零碎的網路廣告市場早已被Google接近獨占地控制,社交網站要勝過真正專業的搜尋引擎,可以說是癡人說夢。
G+怕FACEBOOK嗎?恐怕正好相反!因為G+能產生的經濟效益是遠勝過FACEBOOK的!因為FACEBOOK有著跟它的流量不成比例地低的廣告效益。 相反地,google實現了經濟學中認為最好的狀況:不要想辦法區分客戶有多少消費能力,讓客戶自己在自己身上貼標籤,你就可以把產品正確地呈現給不同屬性的客戶。會看這個網誌的人,本身自然對理財或政治較有興趣,並且會為此主動蒐集資訊,google因此可以遠比facebook更準確地投放廣告。
將各種不同用途的使用者聚集在一個名為社交的場合,總合的效益反而降低,FACEBOOK在承受一樣大的流量的情況下,廣告的效益恐怕是遠遠遜於分進合擊的google adword。FACEBOOK該怎麼辦?如果真被G+發展出夠大的規模,FACEBOOK的廣告市場被侵蝕的情況是可能會遠高於市佔率的萎縮的。
FACEBOOK真的有其總曝光數佔有率超過30%那麼強嗎?不幸地是,google ads的投放率要精準地多,丟在各個零碎網站的聯播網CTR平均約有0.3~0.4,整體甚至高達0.7%(附帶一提這個網誌約為0.3),而且這些點擊還更能準確地投放在能真正對應需求的使用者身上。曝光數、總流量真的顯示出FACEBOOK稱霸無人能敵嗎?恐怕巨大的流量無法帶來等幅度的有效廣告曝光,是FACEBOOK的沉重負擔才是。
本文要表達,看數據辦事前,請先徹底的了解該統計數據(工具的使用說明書)的來龍去脈。不是抓一堆數字拿出來說這東西很好就好。
回覆刪除真是超級好文!!
回覆刪除不過生為一個經濟系畢業的棒球迷 , 卻從來沒有去懷疑過 OPS , 真是汗顏 ><"
早期大家覺得 打擊率 太粗糙 , 可能掩蓋了很多打擊的其他面向 ,
(書中亦有提)
因此發展了 OPS 等越來越多項指標 ~
沒想到這些也有它們的問題。
我的看法是
回覆刪除G+的+1實際上是從Facebook的讚抄襲而來的
Facebook「讓用戶為自己貼標籤」的能力甚至比Google更強
(這就是「臉書」的原意啊)
但Facebook至今沒有法發展出足以和Google搜尋一樣可以有效針對客戶投放廣告的途徑
BTW
作為一個社交網站
G+已經快變空城一座了
你說的是台灣G+吧?
回覆刪除人們進行 Google 搜尋就是爲了找東西,既然知道使用者「要」什麼東西,投的廣告當然效益好。
回覆刪除G+確實人比較少,但會說是鬼城的大概沒有仔細用過 Google+。就像不久前也有人說 Twitter 是鬼城一樣。
(看來現在鬼城正夯?)
作者已經移除這則留言。
刪除我住的鬼城還蠻熱鬧的啊XD
回覆刪除GOOD POINT!
回覆刪除請問大大
回覆刪除ARO = 到達率 ╳ Web連線到達率 ╳ 單次造訪停留時間
其中到達率跟Web連線到達率是如何算出來的?
FB會只有拿ARO這一種指標來蠱惑嗎?還是說只是一些媒體的吹捧
謝謝
棒球打擊率那個是否就是電影"魔球"所說的?
回覆刪除OPS有過度重視安打的情況,所以可以考慮使用wRC或
回覆刪除wOBA來取代,但是因為很難算,所以變成一定要有東西可以查,就沒那麼方便了。